Alfabetización en Datos
Por Flavio Fazzano, socio director de IT Maker
Las habilidades de alfabetización siempre han sido una prioridad en el sistema educativo, ¡y con gran razón!. Del mismo modo, las habilidades de alfabetización en datos vienen ganando terreno en la medida en que las organizaciones buscan cubrir lugares donde se necesite manejar datos e información.
En el mismo sentido, las organizaciones están comenzando a depender cada vez menos de información preprocesada y de sus “propios instintos” como paradigma de toma de decisiones.
Esto nos lleva a concluir que es cada vez más importante que comencemos a alimentarnos con habilidades de pensamiento crítico para crear soluciones o dar respuestas verdaderamente innovadoras. Sin embargo, muchos de nosotros no tenemos muy en claro qué significa la alfabetización de datos, y menos aún las habilidades y técnicas que podrían ayudar a aumentarla.
Este artículo explora muy brevemente 5 áreas clave que nos ayudarán a en mejorar el entendimiento al momento de analizar un informe o una noticia o simplemente para responder de forma más asertiva: tendencias y contexto; datos internos y externos; análisis de clusters; promedios, agregación y distribución; sesgo y correlaciones no causales.
Es importante recordar la definición de alfabetización de datos, que es la habilidad para leer, analizar, trabajar y argumentar con datos (ver edición julio 2021 de Neurona).
Aumentar las habilidades de alfabetización en datos, en cada persona de su organización, puede tener un impacto importante en que:
- Aumenta la adopción y el conocimiento de las herramientas analíticas con las cuales cuenta (o está por adquirir).
- Ayuda a crear una cultura impulsada por datos
- Se obtiene un mayor valor de la inversión en datos (y más rápido)
Un ejemplo del uso de alfabetización de datos
La dirección de una empresa ha solicitado ver la tendencia de los ingresos o ventas de los últimos años. Si mostrara la visualización de la figura 1, el consenso podría ser que están muy bien y no hay mucho de qué preocuparse.
Sin embargo, si mostrara los mismos datos, pero sólo observando los ingresos por año, la dirección podría llegar a una conclusión muy diferente.
Este es un ejemplo muy simple de la importancia de analizar realmente lo que los datos están mostrando o posiblemente ocultando.
Veamos un breve resúmen de las 5 áreas que nos ayudarán a tener un mejor entendimiento de una situación:
- Tendencias y contexto
Mostrarle a alguien una serie de números puede ser interesante, pero es poco probable que proporcione mucha información. Incluso una serie de números relacionados entre sí tiene un interés limitado. Tome el siguiente indicador clave de rendimiento (KPI) como ejemplo:
Ahora cuando lean una noticia como “Las ventas en los shopping aumentaron 15% en julio”, las primeras preguntas que nos haríamos serían ¿Contra qué lo comparan? ¿Contra las ventas del mes anterior o, las del mismo mes pero del año pasado? ¿Están comparando pesos o cantidades? ¿En el análisis se comparan los mismos productos? ¿El monto de la venta se debió a que aumentaron precios o porque vendieron mayor cantidad?, y así otras preguntas, debido a que no contamos con el contexto completo para aceptar que el aumento de las ventas realmente se debió a mayor demanda de los productos.
1- Datos internos y externos
Hay una serie de consideraciones sobre cómo manejar los datos internos, especialmente al hacer comparaciones dentro de una misma organización. Es de vital importancia que se tenga en cuenta el contexto económico y el mercado en general.
Si analizamos una organización con múltiples oficinas o locales comerciales, no deberíamos compararlas de la misma manera porque factores como el nivel socio económico de la zona de influencia, la cantidad de metros comerciales del local, ubicación física, la densidad de población, etc, afectan al resultado.
Cuando compare con datos externos utilícelos para proporcionar un contexto más amplio a su desempeño o para ayudar a normalizar aún más sus datos y medidas.Hable con sus colegas y dedique tiempo a investigar. Es posible que se sorprenda de lo que está disponible a bajo costo o sin costo. La utilización de funciones de mapas de herramientas de análisis lo ayudarán a tener mejor visualización de los análisis
2- Análisis de Clusters
El análisis de cluster agrupa entidades con atributos similares y compara su desempeño con el objetivo de encontrar patrones, comportamientos o conocimientos relacionados con ese cluster o en comparación con otros clusters
3- Promedios, agregación y distribución
Los promedios y otras agregaciones son útiles, pero tenga en cuenta lo que pueden ocultar. La mediana y la moda pueden ser útiles para comprender mejor las distribuciones dentro de un conjunto de datos. Veamos el ejemplo de sueldos:
Podría pensar que este es un buen salario promedio. Sin embargo, si miramos la distribución del salario, entonces el salario promedio anterior esconde una situación de alta desigualdad salarial.
Entonces podemos ver otros promedios más útiles
Utilizar una combinación de métodos puede resultar útil para obtener una imagen más completa de los datos.
1- Sesgo y correlaciones no causales
Hay muchas formas de sesgos y puede ser justo decir que todos tenemos algún tipo de prejuicio basado en nuestra experiencia del mundo y el conocimiento acumulado. El sesgo también impregna el ámbito empresarial y puede traducirse fácilmente en la forma en que trabajamos con los datos. No es necesariamente intencional, de hecho, a menudo es subconsciente y rara vez es malicioso. Sin embargo, debemos ser conscientes de su existencia y estar seguros de cuestionarnos a nosotros mismos y a los datos sobre si estamos viendo o estamos abiertos a ver la historia real.
Sea consciente de la posibilidad de sesgo en su análisis, sea siempre escéptico y cuestione los conocimientos que encuentre, buscando posibles lagunas o inconsistencias. A menudo, es la unión de la percepción de datos y el conocimiento de negocio lo que ayuda a validar una correlación genuina o identificar una falsa.
Conclusión
Considere cómo puede ayudar a educar y mejorar a los usuarios de su organización con habilidades de alfabetización de datos como parte de cualquier implementación de plataforma de análisis.
Si usted es un desarrollador de aplicaciones de análisis, piense en lo anterior y si puede refinar y mejorar la relevancia, precisión y usabilidad de las visualizaciones que está creando para sus usuarios. Esto ayudará a garantizar un mejor retorno de la inversión, impulsará la adopción por parte de los usuarios y ayudará a su organización a obtener información adicional y una ventaja competitiva.
Al fin y al cabo, para que una organización aproveche los procesos de la transformación digital es necesario también capacitar a su personal en el buen uso de los datos, porque al final de la cadena de la transformación digital hay personas que toman decisiones e impulsan las acciones.
En IT MAKER ayudamos a las personas y organizaciones a resolver problemas de negocio mediante el uso estratégico de sus datos.