La Big Data es el cimiento de Ciudades Inteligentes

Las Ciudades Inteligentes utilizan la tecnología en todas sus formas, para proporcionar de manera más eficiente sus servicios y así mejorar la calidad de vida de sus ciudadanos. Por lo tanto, su vínculo con la Big Data es mayor de lo que pensamos.

Es que las interacciones de las personas a través de sus dispositivos móviles, los miles de sensores y terminales conectados por el Internet de las Cosas (IoT), y otras fuentes de información, proporcionan una masa enorme de datos que, al analizarse, permiten planificar y efectuar acciones relevantes para convertir a las ciudades en inteligentes.

SmartCity

Para sacar beneficios de estos datos, se necesita una plataforma tecnológica que recoja la información en tiempo real, la transmita, la almacene, la procese y la publique de forma inmediata en un soporte digital como, por ejemplo, la pantalla de nuestros smartphones.

Para beneficiarse de la Big Data, primero se deben identificar los problemas que se busca resolver y definir una estrategia basada en lo que realmente sucede en la ciudad. En este camino, los problemas más comunes que se enfrentan son: gran cantidad de información en tiempo real, tiempo de procesamiento, interoperabilidad y compatibilidad.

Big Data ofrece la capacidad de almacenar ese gran volumen de información en una o diferentes bases de datos y, además, a la vez que se guardan, trabajar con ellos eficazmente en el tiempo de procesamiento requerido.

Cómo trabajar un proyecto Big Data para Ciudades Inteligentes

Fabian Garofalo
Fabian Garófalo

Es esencial elegir la arquitectura correcta a la hora de convertir los datos sin procesar en información útil. La arquitectura Lambda es de procesamiento estándar y una de las más implementadas en la tecnología Big Data: es escalable, con tolerancia de fallos tanto de infraestructura como de errores humanos. Posee 3 capas: segmentos, servicios y velocidad y la idea principal es que toda la información que entre en el sistema se encuentre tanto en la capa de segmentos como en la capa de velocidad, para que la información esté siempre disponible.

La arquitectura Kappa, elimina una de las capas y así evita dar mantenimiento a dos sistemas separados (capa de segmentos y capa de velocidad). Los datos son almacenados sin transformar, y todas las vistas que se generan se derivan de esos datos sin transformar.

No se puede hablar de Big Data, y dejar de lado el concepto de bases de datos NoSQL, que son no relacionales y tienen un alto rendimiento y escalabilidad. Para proyectos Big Data en Ciudades Inteligentes se debe utilizar NoSQL, ya que es necesario tener la capacidad de procesar en poco tiempo, una gran cantidad de datos procedentes de diferentes fuentes y de estructuras independientes.

Bases de datos NoSQL

Base de datos clave-valor: Es el modelo NoSQL más popular y sencillo. Cada elemento está identificado por una llave única, por lo que, para realizar búsquedas, lecturas o escritura, el sistema es muy eficiente.
Base de datos documental: Almacena la información en documentos, utilizando diferentes estructuras como pueden ser JSON o XML. Permite realizar consultas más avanzadas sobre el contenido del documento.
Base de datos en grafo: Para tener el máximo rendimiento, su estructura debería estar totalmente normalizada, de manera que cada tabla tenga una sola columna y por cada relación, dos.
Bases de datos orientadas a objetos: En este caso, la información se representa al igual que en los lenguajes de programación orientado a objetos (como Java).

Las “5 v”de la Big Data y la gobernabilidad

El principal desafío para trabajar con esta tecnología en proyectos Big Data para Ciudades Inteligentes es la necesidad de gestionar y realizar proyectos con datos de calidad. Las cinco características que deben tener unos datos para ser de calidad son: volumen, velocidad, variedad, veracidad y valor.

Hasta ahora, estos datos eran introducidos mediante procesos ETL (Extract, Transform and Load), pero ahora podemos cargar información adicional que no se encuentre almacenada dentro del sistema en consideración, como datos obtenidos de sensores, o de un smartphone o el número de likes de una red social.

Los controles granulares de proyectos de Big Data se logran a través de las expresiones de control de acceso, que usan agrupación y lógica booleana para controlar el acceso y autorización de datos flexibles, por medio de permisos basados en roles y configuraciones de visibilidad.

En el nivel más bajo, se protegen los datos confidenciales, ocultándolos. Y en la parte superior, se tienen contratos confidenciales para científicos de datos y analistas de Business Intelligence. La estrategia no funciona sin una auditoría. Ese nivel de visibilidad y responsabilidad en cada paso del proceso es lo que permite gobernar los datos.

Por: Fabián Alejandro Garófalo
Asesor de organismos de estado, fuerzas de seguridad, de la Red de ciudades Inteligentes de Argentina (RECIA) y del Instituto Ciudades del Futuro.