Dadme datos y moveré el mundo

Si tu infancia se desarrolló en los años 80 del siglo pasado (y si no, puede que también te suene), es posible que recuerdes la película “Cortocircuito”, con aquel robot, Johnny 5, que al grito de “Datos, más datos!!”, absorbía información pasando las hojas de la enciclopedia de forma desenfrenada.

Hasta hace pocos años, los libros representaban una de las principales formas de obtener conocimiento (aún lo siguen siendo y espero que por muchos años). Sin embargo, en la actualidad, estas fuentes han sido desplazadas por uno de los vocablos de moda: el big data o los macrodatos, alternativa de denominación recomendada por Fundeu (en el siguiente gráfico interactivo puedes ver la evolución de búsquedas en Google experimentada para el término “big data”).

 

Enrique Dans define el big data en su blog como el «tratamiento y análisis de enormes repositorios de datos, tan desproporcionadamente grandes que resulta imposible tratarlos con las herramientas de bases de datos y analíticas convencionales». Es decir, información a mansalva procedente de múltiples dispositivos y canales.

Tradicionalmente, ha sido un término ligado al mundo de los negocios a través del cual conocer el comportamiento de los consumidores para poder vender más y mejor y satisfacer las necesidades de los clientes de forma más eficaz. No en vano, cada clic que efectúas frente a tu ordenador, cada tuit que envías o cada “Me gusta” que haces en Facebook sirven para caracterizarte y crear un perfil sobre tus gustos y/o necesidades.

Pero el objetivo de este artículo no es adentrarse en este tipo de aprovechamiento que, al menos personalmente, considero un poco perverso y me genera cierto grado de incertidumbre.

En este escaparate que me brinda iAmbiente hablo habitualmente de aplicaciones, dispositivos del internet de las cosas o sensores y ¿qué es lo que recopilan y ofrecen muchísimos de estos aparatos? Datos, millones de datos ambientales sobre contaminación, caudales de los ríos, consumo de agua, tráfico en las ciudades, sistemas de iluminación viaria, producción de energía renovable, rendimiento de los cultivos, etc. Como recuerda el Banco Interamericano de Desarrollo en un interesante artículo de octubre de 2015, «la disponibilidad de datos de calidad es esencial para monitorear impactos y resolver los problemas ambientales».

Uno de los aspectos que mayor interés está despertando en relación con el aprovechamiento del big data es la lucha contra la contaminación atmosférica, siendo uno de los principales actores la multinacional IBM. Esta empresa, basándose en su sistema de inteligencia artificial IBM Watson, está desarrollando el proyecto Green Horizons, una solución para predecir la contaminación que está siendo adoptada por ciudades como Pekín, que batallan cada día contra unos alarmantes niveles de polución. El sistema se alimenta básicamente de datos, procedentes tanto de sensores que miden la polución como de información que comparte la gente en redes sociales, por citar un par de fuentes. Esta información, cruzada con previsiones meteorológicas, morfología de la ciudad, orografía del entorno, etc., permite predecir episodios graves de contaminación con hasta 72 horas de antelación, lo que permite a las autoridades alertar a la población.

El big data también puede resultar de provecho para el estudio del fenómeno del cambio climático (el vínculo entre este problema y la contaminación atmosférica es patente cuando se tiene en cuenta que muchos de los gases emitidos contribuyen a la transformación en las condiciones climáticas). Sobre esta temática versaron dos jornadas que la Fundación Ramón Areces organizó en Madrid los pasados días 29 de febrero y 1 de marzo (puedes leer un resumen en esta reseña de Diego Vilela Herranz y dos artículos en el número de diciembre de 2015 de la revista de la fundación). En este caso, los beneficios se manifiestan en la posibilidad de explorar patrones de datos recogidos a lo largo del tiempo. En base a esta información, se pueden definir modelos que puedan anteceder escenarios de sequía, por ejemplo (en esta tarea, entra en juego la conocida como minería de datos). Y a través de la visualización de datos, otra técnica íntimamente ligada al big data, también se pueden contar historias que ayuden a la comunicación de los aspectos científicos tales como de qué forma el polvo sahariano afecta al clima y a la salud. 

Otro sector en el que el big data puede jugar un importante papel es la agricultura (recuerda que dentro de unos años habrá que alimentar a unos 9.000 millones de personas, así que cualquier ayuda es bienvenida). Según comentan en un reciente artículo del blog “Big data con patatas” (si crees que no puede existir un blog con ese nombre, pincha en el enlace), «la recogida de datos masivos puede, entre otras cosas, ayudar a los productores a elegir qué plantas cultivar y el momento y lugar exactos de la siembra. Se ha comprobado que los agricultores que utilizan un sólo tipo de tecnología de precisión lograron aumentar su rendimiento en un 16% y reducir a la mitad el consumo de agua». Otra utilidad del big data aplicado al sector agrícola también puede ser, por ejemplo, un uso más eficiente de los sistemas de riego al tener en cuenta previsiones meteorológicas con el grado de humedad del suelo o, echando un vistazo a la actividad ganadera, la posibilidad de practicar una “medicina veterinaria de precisión” donde los macrodatos están incorporando información genética de los animales que permiten mejores diagnósticos y resultados en los medicamentos administrados. Por cierto, ¿sabes que una de las empresas que más eco está alcanzando en esto del big data agrícola es Dinsa, una firma con sede en Madrid que ha desarrollado una plataforma de nombre bynse que ofrece varias soluciones en este campo?

Quizás haya llegado el momento de reinterpretar la célebre cita de “Dadme un punto de apoyo y moveré el mundo”. El big data lleva camino de convulsionar en nuestras vidas como nunca pudo imaginar Arquímedes.