He visto que varios argumentan que el Gobierno de Datos debe avanzar antes que la Analítica, mientras otros dicen que primero debe avanzar la Analítica y luego el Gobierno de Datos
Para mi el asunto es claro:
"Sin Gobierno de Datos no hay Analítica... y viceversa"
Si no avanzan juntos, no avanza ninguno
Así como el Joyero necesita oro puro para fabricar una joya, así también la Analítica necesita datos puros para producir información valiosa para tomar decisiones. Esta metáfora del oro es una buena forma de explicar cómo los datos deben ser gestionados, para servir como el insumo que la Analítica necesita para operar.
En el caso del oro, las vetas de mineral en bruto se encuentran ocultas bajo la tierra y actividades de prospección y descubrimiento deben desplegarse al inicio para descubrir los yacimientos y determinar cuándo es conveniente instalar capacidades para su extracción.
Lo mismo ocurre con los datos. No es obvio que un dato almacenado en un repositorio sirva per se para alimentar modelos analíticos. Descubrir las fuentes y acreditar los procesos que las alimentan, identificar los puntos de extracción adecuados, determinar si se trata de originales o copias y si existen mecanismos de sincronización, son ejemplos de consideraciones básicas a tener en cuenta antes de extraerlos.
Luego de extraído, el mineral en bruto debe someterse a procesos de purificación que lo convierten en el oro puro que requiere el Joyero.
Los datos también requieren de procesos de purificación para convertirse en datos puros. Aplicación de reglas de negocio para certificar la calidad, homologación de datos codificados de forma heterogénea, consolidación de datos maestros, son ejemplos de estos procesos.
Una vez purificado, el oro es moldeado en lingotes y almacenado, para estar disponible al momento en que sus compradores lo demanden, adecuando su disponibilización a los requerimientos de gramaje y kilates de cada cliente.
Los datos puros también deben ser almacenados como los lingotes para estar disponibles al momento en que los procesos de la Analítica los requieran. Data Warehouses, Data Lakes y otras formas de almacenamiento, conviven con Datamarts, DataOps, APIs, Web Services, archivos planos y otras técnicas de disponibilización.
Los procesos de descubrimiento, extracción, purificación y disponibilización del oro son habilitantes del trabajo de Joyero. Se trata de procesos de ingeniería intensivos en la aplicación de tecnologías específicas para esa industria. El Minero es el profesional responsable de liderar esos procesos. Su trabajo puede parecer distante de las joyas que los amantes del oro buscan en los escaparates de las Joyerías. Pero que duda cabe, si no hubiera minería, tampoco habrían joyerías.
Los procesos para descubrir, extraer, purificar y disponibilizar datos son habilitantes de la Analítica. Al igual que en la minería, se trata de procesos de ingeniería intensivos en la aplicación de tecnologías específicas para esa industria. El Gobierno de Datos es la disciplina que agrupa estos procesos que convierten datos en bruto en datos puros. Un eslabón intermedio en una cadena de procesos que operando integrada, permite utilizar los datos como verdaderos activos para tomar decisiones valiosas.
Así como el Joyero y el Minero trabajan codo a codo, pese a que en la práctica nunca se encuentren cara a cara, así también los profesionales del Gobierno de Datos y los de la Analítica colaboran para lograr los objetivos que comparten. Las diferencias en su formación, conocimientos y experiencia les permiten rendir al máximo en sus respectivas disciplinas, y así como no se pretende que el Joyero extraiga el oro desde la tierra, tampoco es razonable pretender que el Analista extraiga los datos desde sus fuentes originales.
Gobierno de Datos y Analítica son disciplinas complementarias y a la vez mutuamente dependientes.
Es frecuente que personas claves en la toma de decisiones para la conducción de procesos de Transformación Digital desconozcan la interdependencia del Gobierno de Datos y la Analítica y demoren la adopción de modelos de relacionamientos entre ambas disciplinas, intentando torpemente el avance de cada una de ellas por separado, especialmente el avance unilateral de la Analítica Avanzada.
Es posible que Organizaciones pequeñas o soluciones departamentales que inician las prácticas de Analítica con una herramienta básica de Business Intelligence logren resultados satisfactorios definiendo que cada Analista es responsable de conseguir los datos que alimenten sus respectivos modelos, en la medida en que se cumplan ciertas condiciones:
Que el analista posea las habilidades blandas para el relacionamiento con las numerosas contrapartes con las que habitualmente deberá interactuar
Que el analista conozca los datos que utilizará en sus modelos y los procesos de negocio que los originan respectivamente
Que disponga de una contraparte de negocios a la cual puede realizar consultas respecto de los contenidos y significados de cada campo
Que disponga de otra contraparte mas técnica a la cual puede recurrir cuando sus dudas refieran a diseños en la base de datos, sus esquemas, tablas y columnas
Que disponga de otra contraparte a la cual exponer diferencias, inconsistencias u otros errores detectados en los datos para su análisis y correcciones
Que la base de datos esté disponible para ser accedida, que sus datos no hayan sido encriptados por el fabricante del software ni que se trate de Software as a Service, sin visibilidad de la base de datos
Que se le autorice acceso directo de lectura a la base de datos productiva en la que se encuentran los datos que desea utilizar en su modelo, asumiendo los riesgos
Que los datos requeridos se encuentren en la base de datos de su organización y no requiera extraer y utilizar datos de otras organizaciones
Que los datos que utilizará en su modelo sean mantenidos persistentemente en la base de datos del aplicativo, que no cambien ni se borren en el tiempo
Estas y otras condiciones caracterizan el quehacer de analistas de Business Intelligence en organizaciones o equipos pequeños, que pueden entregar buenos resultados con su trabajo pese a todas las restricciones y limitaciones que enfrentan.
En cambio, en organizaciones que aspiran a disponer de mas datos o a ejecutar prácticas mas complejas de Analítica Avanzada, ninguna de estas condiciones por lo general se cumple. En estos casos, asignar al Analista la tarea de conseguir los datos es un grave error que provoca pérdida de tiempo, esfuerzo y dinero a las organizaciones, hasta que sus directivos tomen conciencia de que el problema de la captura y disponibilización de datos es una tarea compleja, de alto esfuerzo (4 a 1 vs Analítica) y que requiere de profesionales especializados para su ejecución.
Que el Gobierno de Datos avance antes de la Analítica solo se justifica cuando el objetivo es poner los datos bajo control, por ejemplo, en casos de requerimientos de cumplimiento normativo. Salvo ese caso, la razón de ser del Gobierno de Datos es proveer de datos a la Analítica, de preferencia en un esquema de relacionamiento del tipo cliente - proveedor. Por ende, es también indispensable que el cliente formule su requerimiento para que el proveedor realice las actividades de provisión de datos de la forma correcta.
La identificación de las disciplinas de Gobierno de Datos y Analítica de Datos y la elaboración de un modelo de relacionamiento que les permita operar como funciones complementarias y mutuamente dependientes, debe ser abordado como una tareas de Desarrollo Organizacional. La carencia de conocimiento de modelos operativos adecuados a los propósitos descritos es a mi juicio la causa principal de malas decisiones de diseño organizacional al implantar el Gobierno de Datos y la Analítica Avanzada.