Big Data Analytics y Machine Learning, servicios para las Ciudades Inteligentes

Big Data Analytics (BDA) y Machine Learning (ML) permiten a las Ciudades Inteligentes (CI) adquirir información increíble a partir de un inmenso volumen de datos generados a través de fuentes heterogéneas, tales como sensores integrados IoT, etiquetas RFID, sistemas GPS, teléfonos inteligentes y dispositivos Bluetooth, entre otros.

Con Big Data Analytics, las Ciudades Inteligentes pueden gestionar eficazmente la recolección de residuos, disminuir la contaminación del aire, mejorar la calidad de la asistencia sanitaria y el transporte, garantizar la utilización eficiente de la energía, tomar medidas de seguridad predictivas y construir estrategias efectivas de gobernanza y de seguridad ciudadana, entre otras, generando el potencial de revolucionar el estilo y calidad de vida humano y el nivel de vida.

De manera análoga a los procesos y estándares de reciclaje de residuos en las ciudades urbanas, existe la necesidad de procesos y mecanismos para el reciclaje de datos en las Ciudades Inteligentes, donde se generan cientos o miles de Gigabytes de datos por segundo. Los métodos de análisis de los mismos y los algoritmos de aprendizaje automático deberían poder extraer conocimiento e información útil de dichos datos para reducir la cantidad de desperdicio digital.

Cuando los datos de CI no se utilizan para el aprendizaje y el análisis a corto plazo, es poco probable que se lleguen a utilizar más tarde.

Según IDC[1], solo para 2017, aproximadamente el 0.5% de todos los 2.8 Zettabytes (ZB) de datos almacenados habrían sido analizados y el 3% de ellos estarían etiquetados.

Últimamente, ha habido discusiones sobre la gobernanza, la gestión y el almacenamiento de la Big Data de CI, pero no hay una respuesta clara sobre cómo utilizar las enormes cantidades de datos recopilados. Aunque en muchos casos el muestreo se aproxima a la solución, para los servicios de CI donde la preferencia de los ciudadanos juega un rol importante, o las actividades individuales afectan a toda la comunidad, el muestreo puede no ser ideal.

Los ecosistemas de CI tienen las siguientes características desde una perspectiva de Machine Learning

  • Los humanos necesitan interactuar con los sistemas para proporcionar sus comentarios.
  • Muchos sensores y dispositivos inteligentes generan datos a gran velocidad. No todos los datos pueden ser revisados ​​por humanos, pero el sistema debe aprender y mejorar a partir de experiencias previas.
  • Necesitan un mecanismo de aprendizaje general, dinámico y continuo, ya que el contexto de una aplicación de CI no siempre es fijo y el entorno operativo de las aplicaciones de CI evoluciona con el tiempo.
  • Los datos generados por las aplicaciones de CI ciertas veces poseen cierto grado de incertidumbre.

La necesidad de enfoques de Machine Learning y además de Deep Learning e Inteligencia Artificial, sumando modelos predictivos, surgen de la necesidad de extraer abstracciones de alto nivel de los datos sin procesar.

La combinación de estas técnicas puede ayudar a extraer el mayor valor de los grandes volúmenes de datos generados por las CI.

Big Data Analytics y Machine Learning, un servicio compatible con la nube para servir a las ciudades inteligentes

La CI cognitiva se refiere a la convergencia de diferentes tecnologías emergentes en CI, sus datos generados y las técnicas ya descriptas. Son sistemas que pueden aprender de una amplia gama de conjuntos de datos, pueden proporcionar razones, interactuar con los humanos a través de lenguajes naturales y obtener sus experiencias en el contexto.

El marco ofrece tres niveles de inteligencia: el nivel de CI y la infraestructura de IoT, la computación en la niebla (fog computing) y la computación en la nube.

El desarrollo de aplicaciones de CI soportadas por  Big Data Analytics y Machine Learning está sujeto a varios desafíos que deben abordarse para lograr un sistema confiable y preciso.

Algunos de los principales desafíos, más allá de los introducidos por las 5V´s incluyen:

  • Integración y análisis de grandes volúmenes de datos.
  • Escasez de conjuntos de datos validados.
  • Preservación de la seguridad y la privacidad.
  • Inteligencia en el dispositivo.
  • Conocimiento del contexto.

Además, existen otros desafíos que afectan el diseño de un ecosistema de CI, como la integración de diferentes marcos analíticos, la distribución de operaciones analíticas y la falta de bancos de pruebas integrales. Interactuar con los humanos de forma natural es una necesidad crítica para la nueva generación de sistemas de CI, ya que los ciudadanos son los principales actores en las mismas

Por: Fabián Alejandro Garófalo.
Asesor de organismos de estado, fuerzas de seguridad, de la Red de Ciudades Inteligentes de Argentina (RECIA) y del Instituto Ciudades del Futuro.