¿Cómo pueden las empresas adoptar el Big Data? Parte 3

¿Cómo pueden las empresas adoptar el Big Data? Parte 3

Anddy I. Cabrera Carela.

En esta tercera y última parte de la serie de artículos dedicados alos retos que se enfrentan las organizaciones dentro de las iniciativasBig Data, explicaremos las principales características, responsabilidades y habilidadesde dos de los perfiles más importantes: el Científico de Datos (Data Scientist) y el Especialista en Visualización (Data Visualization Expert).El objetivo en este caso es entender en qué consiste el trabajo de estos perfiles.

Antes de entrar en detalle sobre cada uno de ellos,en el artículo “Data Scientist: The Sexiest Job of the 21st Century”, de la revista Harvard Business Review, se presenta en detalle las características que debe tener un científico de datos. Expone que “Si la capitalización de Big Data depende de la contratación de científicos de datos escasos, entonces el desafío para los gerentes es aprender cómo identificar ese talento, atraerlo a una empresa y hacerlo productivo».

Ademásdescribelas responsabilidades como:“lo que hacen los científicos de datos es hacer descubrimientos al nadar en datos”, y concluye “¿Qué clase de persona hace todo esto? ¿Qué habilidades hacen que un científico de datos tenga éxito? Piense en él o ella como un híbrido de hacker de datos, analista, comunicador y asesor de confianza. La combinación es extremadamente poderosa y rara.”

Ha surgido una gran demanda de un perfil que hasta ahora prácticamente no existía, ya que se precisan conocimientos de estadística y matemática que un programador no suele tener y conocimientos informáticos que un estadístico no suele ni siquiera imaginar. Esta es la razón de la escasez y que en este frente la demanda se haya adelantado a la oferta.

El primer paso para satisfacer la necesidad de los científicos de datos, por lo tanto, es entender qué hacen en las empresas.Esta persona es la encargada de extraer conocimiento y valor de la información.Su trabajo es descubrir relaciones y patrones ocultos entre los datosa partir del desarrollo de modelos analíticosy la explotación de herramientas de analítica avanzada para el análisis de estos mismos datos.Dado el estado incipiente de su oficio, a menudo los científicos de datos tienen que diseñar sus propias herramientas e incluso realizar investigaciones de estilo académico.

Las principales tareas y responsabilidades del científico de datos son:
 Análisis de la información procedente de las fuentesinternas y externas de la organizacióncomo pueden ser datos de las operaciones,información sobre usuarios, ingresos, sitios web,redes sociales o bases de datosabiertas.

 Desarrollo de modelos analíticos de carácter descriptivo, es decir, analizar lo que ha pasado;de carácter predictivo, o analizar lo que podría pasar;así como de carácter prescriptivoque son los modelos basados en probabilidades de que algo ocurrasegún las decisiones que se van tomando.

 Realización de tareas de reporte de las principalespercepciones de negocioo resultados para la compañía, obtenidos de la ejecución de modelos analíticos desarrollados, de forma que los perfiles más funcionales de la organización sean capaces de comprender dichos resultadosy definir acciones de negocio a partir de estos.

 Desarrollo de los trabajos de descubrimiento de fuentes externas de informaciónque favorezcan el enriquecimiento de los datos internos de la organizacióny, por ende, los casos de uso,así como la evaluación de modelos analíticos desarrolladosy la comunicación de los resultados obtenidos a las áreas de negocio.

Es por esto, quelos perfiles deberían tener una sólida formación que garantice el enfoque matemático avanzado,en estadística y matemática,conceptos de programación en diferentes entornos de desarrollo,capacidades para entender el valor de los datosy conocimientos referentes a los procesos de transformación de los mismos.

Por otra parte, el especialista en visualización (Data Visualization Expert) es el responsable del diseño e implementación de las técnicas de visualización interactivas.Tiene en cuenta el modelo de datos, con el objetivo de que los usuarios finales sean capaces de extraerel conocimiento con mayor valor para el negocio.
Las tareas y responsabilidades de este perfil son:

 Comprender las necesidades y requerimientos de negocio para así poder elegir las técnicas de visualización más adecuadas.En definitiva, son los responsables últimos de la presentación de datos, diseño de tableros interactivos, informes o reportes,todos ellos adaptados a las necesidades del negocio.

 Conocer bases de datos y herramientas comerciales de visualizaciónasí como tener cierta sensibilidad en cuanto al diseño gráfico para la presentación de resultados.

Como conclusión cabe resaltar la importancia de ambos perfiles en la extracción del valor de los datos,cada uno de ellos en su campo de actuación. El Data Scientist se centra en la elaboración de los modelos analíticos óptimospara cada caso de usoy el Data Visualization Experthace que los resultados sean legibles de forma sencilla a los usuariosque necesitan tomardecisiones en base a la información obtenida.

Sobre el autor: Anddy I. Cabrera Carela es experto en IA, con un grado certificado por la Universidad de Harvard en Machine Learning. Además, es matemático, programador y estadístico.