Eduardo Poggi: “en ciencia de datos hay una conversación constante con la información”
La transformación digital que vivimos ha hecho posible que aparezcan nuevas fuentes de datos de complejidad y volumen crecientes. La incorporación de tecnologías también ha implicado el surgimiento de métodos para su almacenamiento, y de la extracción de la información a partir de esa masa de grandes datos (comúnmente conocida como Big Data) se ocupa, entre otras, la “Ciencia de los Datos”.
Neurona Buenos Aires dialogó con Eduardo Poggi, uno de los referentes de esta disciplina en desarrollo ascendente, y, en su doble rol, de especialista en la materia, y Asesor en la Dirección de Analítica de Datos de la AFIP, analizó las distintas aristas de los grandes datos. También de su implementación en distintas organizaciones, de la confluencia de sectores, responsabilidades y profesionales, como así también de las herramientas, tecnologías, métodos y sistemas necesarios para manejar esos grandes conjuntos de datos distribuidos, heterogéneos, diversos, tan grandes y complejos que no se pueden trabajar a la manera tradicional.
“Siempre orienté mi carrera a los datos, la lógica, la inteligencia artificial, que era lo que más me gustaba. La vida profesional me llevó para otro lado, pero desde lo académico me mantuve en lo que hoy llamamos “Ciencia de datos” y Big Data, cuya base viene de los algoritmos que utilizábamos en aprendizaje automático a fines de los ´80. Ahora me ocupo full time de “Ciencia de datos””, explica Poggi sobre el devenir de su vida profesional, vinculada con esta disciplina en formación, donde hay que adaptar estándares y metodologías para su implementación.
Poggi arrancó a trabajar en la AFIP sólo por tres años y se quedó. “Ahora participo activamente como asesor de la Dirección de Analítica de Datos, un área nueva, que ayudo a armar con un grupo de trabajo potente, donde busco que mi aporte sea amplio y global, ya que no es mi intención competir con los jóvenes profesionales, formados con maestrías en Minería de Datos”, indica.
Analítica de datos en la AFIP
“En Argentina no hay muchas organizaciones que tengan áreas de analítica”, explica el especialista. Y aclara que, si bien hay variada experiencia internacional, a nivel local está poco extendida, sólo en algunos bancos, compañías de retail y de telecomunicaciones.
Esa afirmación ubica a AFIP como pionera en la creación de un área dedicada a los grandes datos y a la ciencia que los estudia, analiza y explota: Se trata de un área que provee de información transversal a todo el organismo y es la máxima autoridad la que la impulsa, para que surja información importante a partir del cruce de información de distintas fuentes del negocio, que hasta entonces se miraban como nichos diferentes. “En la Dirección de Analítica, desde hace poco menos de un año, tratamos de cubrir todo el espectro de datos. Actualmente, lo más fuerte se vincula con reporting, y ya hemos tenido unas experiencias de modelos predictivos interesantes. Trabajamos fuerte para avanzar en ese sentido, porque la cantidad de datos es inmensa y hay mucha materia prima para hacerlo, y tenemos que conjugarlo con temas de calidad, seguridad, etc”, señala Poggi.
La Dirección de Analítica está separada de la de sistemas y, eso le da autonomía y peso propio, “pero también genera algunas tensiones –evalúa-, porque hay que redefinir procesos. Hasta la creación de Analítica, del área de Sistemas nunca se habían sacado datos masivamente fuera de sus zonas protegidas. Ahora eso debió cambiar para que se pueda trabajar con libertad en esa información”.
El equipo
“Ningún proyecto interesante en analítica se hace con un solo perfil”, sentencia Poggi. Y luego explica que tienen que integrarse equipos de trabajo con gente que sepa cómo recuperar y sacar los datos. Otros que entiendan de controles de calidad, limpieza y preparación de los datos y otros que manejen reporting, para mirar la información más fina y encontrar rarezas e irregularidades. “También algunos que manejen modelos sencillos, sean predictivos o de segmentación, y la parte de negocio que le da sentido al conjunto”, concluye.
“Ningún proyecto interesante en analítica se hace con un solo perfil”
Definiciones
- En ciencia de datos hay modelos a seguir, pero hay aspectos socioculturales que son distintos.
- Por más que tengamos técnicos, hardware, software y herramientas, tenemos que ir haciendo esta cultura de tener los datos a la vista, mirarlos, usarlos y después ponerlos en la balanza con otros factores.
- Esta disciplina implica una conversación constante y un feedback con la información; uno pregunta una cosa y, a veces, los datos responden otra.
- Trabajamos con ciclos cortos y metodologías ágiles; así avanzamos.
- El área de calidad de datos es muy necesaria para integrarlos en un mismo reservorio, porque hoy conviven muchos sistemas, que se fueron haciendo en momentos distintos, por gente diferente.
- En AFIP trabajamos para implementar un gobierno de datos para analítica.
- Primer stage: hacemos un espejo de los sistemas transaccionales. Segundo stage: para la memoria organizacional, empezamos a estandarizar, con atributos, valores y estructuras. Esa es la base para armar otras capas donde los datos están estructurados y se empiezan a enriquecer.
Mira la nota completa