Diferencia entre un ingeniero de datos y un científico de datos

Nos encontramos en la era de los datos. Cada vez son más las empresas digitalizadas que buscan la manera más eficiente de gestionar la información que les llega de sus clientes y, por otro lado, cómo analizar esos datos, para extraer conclusiones y mejorar sus estrategias comerciales.

En este proceso de gestión y estudio de los datos, entran en juego dos figuras muy importantes: el ingeniero de datos y el científico de datos.

En este artículo veremos en qué consiste el trabajo de cada uno de ellos y su diferencia.

Ingeniero de datos

Las empresas necesitan desesperadamente profesionales de datos que les ayuden a crear una estructura de obtención y gestión para impulsar su crecimiento.

Aquí es donde aparece la figura del ingeniero de datos. Es una especialización dentro del ecosistema del Big Data. Según el Emerging Jobs Report de LinkedIn generado en 2020, se encuentra dentro de los 15 empleos emergentes más destacados en los últimos 5 años. Su demanda no para de crecer, entre 2015 y 2019, según LinkedIn, su contratación ha aumentado un 35%.

¿Qué hace un ingeniero de datos?

Un ingeniero de datos es la persona que se encarga de crear un plan para la adquisición, el almacenamiento, y la gestión de los datos de una organización. Este especialista se hace cargo de la gestión de toda la infraestructura necesaria para que esa gran cantidad de datos no estructurados, se convierta en material comprensible para los data scientists o los data analysts.

El trabajo de un ingeniero de datos consiste en el proceso llamado ETL (Extract, Transform, Load). Se encarga de la extracción, transformación y carga de datos, tratando y estructurando estos datos para que lleguen depurados y normalizados para los analistas y a los científicos de datos.

Para ser un ingeniero de datos es necesario adquirir las habilidades necesarias que requiere el proceso ETL completo. Saber manejar bases de datos SQL y no SQL. Que conozcan el funcionamiento de los servicios cloud como Microsoft Azure o Amazon Web Services. Y que tengan experiencia con el entorno de trabajo de Hadoop. También ayuda tener conocimientos de Apache Spark y Python.

Científico de datos

Muchos científicos de datos empezaron sus carreras como analistas de datos o estadísticos. Pero debido al crecimiento del big data y su tecnología en los últimos años, estos profesionales se fueron adaptando a los nuevos cambios. Los datos se han convertido en información clave y ahí aparece un perfil que analice, con curiosidad creativa y una capacidad de convertir ideas en nuevas formas de generar utilidades. A un científico de datos le gusta explorar, descubrir, crear nuevas fórmulas no sólo copiar un formato.

No existe una definición exacta de la tarea de un científico de datos, algunas de ellas son:

Recopilar grandes cantidades de datos y transformarlos para darle un significado más claro.
Resolver problemas de la empresa a través de técnicas de datos.
Trabajar con diferentes lenguajes de programación.
Tener un amplio dominio de la estadística, una visión global y saber explorar para descubrir nuevas fórmulas.
Conocer y dominar técnicas analíticas como el machine learning, deep learning y analíticas de texto.
Estar en estrecho contacto con el área de negocios y con TI (tecnología de la información).
Encontrar patrones de datos y tendencias que puedan ayudar a mejorar las tendencias de la empresa.

Como hemos visto, mientras los ingenieros de datos destacan por sus amplios conocimientos de programación y ofrecen soluciones software. Los científicos de datos analizan e interpretan grandes análisis de datos.

La distinción de ingeniero y científico de datos es bastante reciente. Pueden causar confusión entre las demandas de empleo y en los perfiles profesionales. A medida que el sector madura, se ven cada vez más claros estos dos perfiles.