Data Science (y un poco de Minería de Datos e Inteligencia Artificial)… PARTE II Por Sergio Uassouf, Customer Advisory, Information & Infrastructure Management, SAS.

Como acordamos en la edición pasada de Neurona Buenos Aires, vamos a la segunda parte de mi definición: “de modo tal de poder analizar con mucho detalle el comportamiento de mis: clientes, ciudadanos, proveedores, productos, transacciones, etc.”

Ya podemos procesar en paralelo, pero ¿Qué algoritmos utilizamos? Las 3 técnicas analíticas fundamentales son: Regresiones, Árboles de decisión y Redes neuronales.

1- Regresiones: Se trata de buscar funciones que relacionen los datos que conozco con el objetivo que persigo. Por ejemplo: una función que relacione la edad, nivel salarial, profesión, estado civil, lugar de residencia y todos los etcéteras que se le ocurran con la probabilidad de que las personas acepten mi nueva oferta de productos, cometan fraude, estén por dejar de ser mis clientes o tengan propensión a tener osteoporosis. Las regresiones suponen que el mundo se relaciona mediante funciones matemáticas.

GRÁFICO 1 – REGRESIÓN 
(Ejemplo ficticio a fines de ilustrar la explicación)
grafico1

2- Árboles de decisión: Se trata de buscar largas cadenas del tipo “Si sucede el evento 1 aumenta la probabilidad de la decisión A, si no sucede aumenta la probabilidad de la decisión B”.  Por ejemplo: Si el cliente es VIP aumenta la probabilidad de que acepte mi oferta, si es un cliente sencillo disminuye la probabilidad. Si su gasto previo en compras es mayor a 1000, aumenta la probabilidad de que acepte mi oferta; si no, la disminuye. Los algoritmos descubren cuáles son las características relevantes para mi objetivo. Los árboles de decisión suponen que el mundo se relaciona con enormes cadenas de decisiones del tipo “Si pasa esto, hago tal cosa; si no pasa, hago tal otra”.

GRÁFICO 2 – ÁRBOL DE DECISIÓN 
(¿Le ofrezco mi producto a este cliente?)
grafico 2

3- Redes neuronales: Una red neuronal es una red de neuronas (¡Guauuu Sergio!, ahora sí entendieron todos). Cada neurona es un elemento de procesamiento independiente. Su funcionamiento está inspirado en cuestiones elementales del conocimiento que tenemos sobre el funcionamiento del cerebro humano (ver Gráfico 3.A).

GRAFICO 3.A – ESQUEMA DE NEURONA REAL
Grafico 3

Cada neurona recibe varios valores de entrada, cada valor de entrada es multiplicado por el peso de la conexión que une a la neurona en cuestión con su predecesora, los productos así obtenidos son sumados. Luego si esa suma supera un valor umbral, nuestra neurona dispara un valor de salida; si no supera el umbral no dispara nada (ver Gráfico 3.B).

GRÁFICO 3.B – ESQUEMA DE NEURONA REAL
Grafico 4
Grafico 4

¿Hacia dónde dispara nuestra neurona ese valor de salida? A la neurona que le sigue. Esta, a su vez recibe varios valores de entrada que se multiplican por los pesos de las conexiones… y así sucesivamente. O sea, armamos una red de neuronas organizadas en capas donde cada una está conectada a todas las neuronas de la capa siguiente hasta que en la última capa obtenemos el resultado buscado.

Por ejemplo, el Gráfico 3.C muestra una red neuronal con 3 neuronas en las que ingresamos el nivel salarial, saldo de la cuenta y tipo de ocupación de un solicitante de crédito, tiene una sola capa intermedia de neuronas y en la capa de salida nos predice si será buen o mal pagador.

GRÁFICO 3.C – ESQUEMA DE NEURONA REAL
Grafico 5

¿Adónde reside la magia? Se produce en el establecimiento del peso de las conexiones entre las neuronas. En nuestra jerga decimos que los algoritmos “entrenan” a la red neuronal a partir de casos cuyo resultado conocemos. Ese “entrenamiento” establece los pesos de las conexiones para obtener el resultado buscado y una vez “entrenada”, utilizamos la red neuronal para que prediga el comportamiento de los casos que no conocemos. Como puede ver, la cosa se complica un poco, pero las tres técnicas que expliqué buscan lo mismo por diferentes caminos:

Hay otra gran cantidad de algoritmos, como Random forest, Gradient boosting, Redes neuronales recurrentes, Redes neuronales convolucionales. Casi todos son variantes de las regresiones, árboles de decisión y redes neuronales que expliqué muuuuuy brevemente más arriba y todas comparten una característica  fundamental: ¡Son paralelizables!

Podemos decir que el conjunto de estas técnicas de análisis constituye lo que llamamos “Minería de Datos”, durante largo tiempo, y cuando el objetivo se hizo más ambicioso “Inteligencia Artificial”. Y así llegamos al final de la historia.

Mensaje comercial

Si se está preguntando cómo sumar esta tecnología a su empresa:
a. Puede recurrir al conjunto de herramientas que ofrece el mercado.
b. Puede utilizar herramientas disponibles en la modalidad open source o…
c. Puede contactar a SAS, empresa para la que trabajo, que provee soluciones de Big Data e Inteligencia Artificial enfocadas en su facilidad de uso (amigabilidad), para que los usuarios de negocio puedan desarrollar procesos analíticos sin necesidad de recurrir al código de programación.

Las soluciones SAS abarcan las tres etapas que requiere este proceso: la preparación de los datos, su procesamiento analítico y su visibilización eficaz. Y su foco principal es la integración y complementación con el mundo open source.

Si mi explicación no le gustó, por favor hágamelo saber para intentar mejorar.

Por: Sergio UASSOUF
sergio.uassouf@sas.com