qué son los datos abiertos
Destaca entrando por una puerta esférica abierta.

¿Qué Son Los Datos Abiertos?

En la actualidad, donde la transparencia y el acceso a la información son pilares fundamentales para el desarrollo económico y social, los datos abiertos emergen como un elemento transformador que democratiza el conocimiento y potencia la innovación. Este artículo proporciona una visión integral sobre qué son los datos abiertos, sus características esenciales, el impacto multidimensional que generan en nuestra sociedad y los desafíos que enfrentan para su implementación efectiva.

Explicación

Los datos abiertos, conocidos en inglés como open data, representan una filosofía y práctica que persigue que determinados tipos de datos estén disponibles de forma libre para todo el mundo, sin restricciones de derechos de autor, patentes u otros mecanismos de control. Este concepto se basa en la premisa de que ciertos tipos de información deben ser accesibles y reutilizables por cualquier persona, en cualquier momento y lugar, compartiendo una ética similar a otros movimientos como el software libre, el código abierto y el acceso libre.

En el ámbito gubernamental, los datos abiertos sirven para que cierta información pública pueda estar a disposición de toda la ciudadanía en formatos reutilizables y digitales, facilitando así, por un lado, la transparencia de las propias administraciones públicas y, por otro, fomentando el desarrollo de nuevas aplicaciones tecnológicas, servicios o negocios por parte de los reutilizadores.

Características Fundamentales

Para que los datos sean considerados verdaderamente abiertos, deben cumplir con un conjunto de características esenciales que garantizan su valor y utilidad. Según el Open Data Handbook y diversas fuentes especializadas, estas características incluyen:

  • Disponibilidad y acceso: la información debe estar disponible como un todo, a un costo razonable de reproducción, preferiblemente descargándola de internet. Además, la información debe estar disponible en una forma conveniente y modificable para facilitar su uso y análisis.
  • Reutilización y redistribución: los datos deben ser provistos bajo términos que permitan reutilizarlos y redistribuirlos, e incluso integrarlos con otros conjuntos de datos. Esto implica que las licencias asociadas deben ser abiertas, permitiendo la libre utilización de la información sin más requisito que la atribución a la fuente original.
  • Participación universal: todos deben poder utilizar, reutilizar y redistribuir la información. No debe haber discriminación alguna en términos de esfuerzo, personas o grupos. Restricciones “no comerciales” que prevendrían el uso comercial de los datos, o restricciones de uso para ciertos propósitos (por ejemplo, solo para educación) no son permitidas.

Características Técnicas Adicionales

Según la Comisión Nacional de Ayuda a Refugiados (COMAR), los datos abiertos también deben ser:

  • Integrales: deben contener el tema que describen a detalle y con los datos necesarios.
  • Gratuitos: deben obtenerse sin costo para la ciudadanía.
  • No discriminatorios: deben estar disponibles para cualquier persona, sin necesidad de registro.
  • Oportunos: deben actualizarse periódicamente conforme se generan.
  • Permanentes: las versiones históricas deben conservarse y mantenerse disponibles para su uso público.
  • Primarios: deben provenir de los productores de la información con el máximo nivel de desagregación.
  • Legibles por máquinas: deben ser procesados e interpretados por equipos electrónicos de manera automática.
  • En formatos abiertos: para su lectura y utilización.
  • De libre uso: la ciudadanía puede citar la fuente de origen como único requerimiento para utilizarlos.

La Importancia de los Datos Abiertos

La “apertura” de datos tiene un impacto significativo en diversos aspectos de la sociedad y la economía, transformando la manera en que interactuamos con la información y tomamos decisiones.

I. Transparencia y Rendición de Cuentas

En el ámbito gubernamental, los datos abiertos juegan un papel clave en la promoción de la transparencia. Permiten que la información pública esté disponible para todos los ciudadanos, facilitando la rendición de cuentas de las administraciones públicas.

Los datos abiertos y la transparencia proactiva son dos de las mejores formas para hacer realidad el principio de máxima publicidad y el derecho humano de acceso a la información pública. Estos tienen el potencial de empoderar a gobiernos, ciudadanía y organizaciones de la sociedad civil para mejorar los servicios públicos, prevenir y combatir la corrupción, y aumentar los niveles de rendición de cuentas.

El Portal de Transparencia del Gobierno de España es un excelente ejemplo de cómo los datos abiertos promueven la transparencia gubernamental. Este portal proporciona acceso a información sobre contratos públicos, subvenciones, presupuestos y otros datos relevantes, permitiendo a los ciudadanos supervisar las actividades del gobierno.

II. Innovación y Desarrollo Económico

Los datos abiertos fomentan la innovación al permitir el desarrollo de nuevas aplicaciones, servicios y modelos de negocio. Emprendedores y desarrolladores pueden utilizar estos datos para crear soluciones que abordan necesidades sociales y económicas.

Según estudios del Portal de Datos Europeo, se estima que el mercado de datos abiertos en Europa alcanzará un valor de entre 199.510 y 334.210 millones de euros en 2025, en comparación con los 184.000 millones actuales. Este crecimiento demuestra el potencial económico significativo que representan los datos abiertos para la creación de nuevos productos y servicios.

El proyecto Aragón Open Data es un caso destacado de cómo los datos abiertos fomentan la innovación. Este portal ofrece datos en formatos abiertos que pueden ser utilizados por ciudadanos y empresas para crear nuevas aplicaciones y servicios.

III. Participación Ciudadana y Gobierno Abierto

La disponibilidad de datos abiertos impulsa la participación ciudadana, creando comunidades de usuarios que comparten ideas y proyectos. Esto permite una colaboración más estrecha entre el gobierno y los ciudadanos en la resolución de problemas públicos.

La integración de los datos abiertos en la gobernanza participativa fortalece los pilares del gobierno abierto: transparencia, participación y colaboración. Al publicar información de manera estructurada y comprensible, se permite a la sociedad civil participar de manera más activa. Por ejemplo, al publicar datos sobre medio ambiente, los gobiernos permiten que los ciudadanos identifiquen problemas, propongan soluciones y monitoreen las acciones gubernamentales.

El Ayuntamiento de Madrid implementó la plataforma Decide Madrid, que utiliza datos abiertos para fomentar la participación ciudadana en la toma de decisiones municipales. Los ciudadanos pueden proponer, debatir y votar iniciativas para mejorar la ciudad, basándose en datos abiertos sobre presupuestos, infraestructuras y servicios públicos.

IV. Mejora de Servicios Públicos e Innovación Basada en Datos

El acceso a datos abiertos permite a las instituciones y empresas mejorar sus servicios. Por ejemplo, en el sector público, puede llevar a una gestión más eficiente y a la creación de servicios más adaptados a las necesidades de los ciudadanos.

Las actuaciones de apoyo a la innovación basada en datos se dirigen a cualquiera de los ámbitos de la cadena de valor del dato, desde la organización y planteamiento de su apertura, pasando por su procesamiento, hasta llegar a la etapa de generación de nuevos productos y servicios. Entre las soluciones innovadoras destacan los sistemas de gestión-visualización de datos, las herramientas avanzadas de apoyo en la toma de decisiones, los sistemas de inteligencia artificial y las técnicas para el procesamiento del lenguaje natural.

Un ejemplo concreto es el cuadro de mando de consumo energético de la Junta de Castilla y León, que ofrece información detallada sobre el consumo de energía en más de 1500 centros públicos. Facilitando la identificación de áreas para optimizar recursos y reducir costes, contribuyendo así a una gestión más sostenible y eficiente.

Tipos de Datos Abiertos

Los datos abiertos abarcan una amplia gama de información que puede ser clasificada según su naturaleza y origen:

A) Por Contenido Temático

  • Información geográfica: límites administrativos, coordenadas de puntos de interés, cartografía.
  • Datos genómicos: mapas genéticos, datos de expresión génica y secuenciación.
  • Datos culturales: bienes culturales, libros, galerías, autores y patrimonio histórico.
  • Fórmulas matemáticas y científicas: modelos estadísticos, algoritmos y simulaciones.
  • Datos médicos y de biodiversidad: registro de especies, datos epidemiológicos y registros sanitarios.
  • Información meteorológica: datos de precipitaciones, temperaturas y previsiones climáticas.

B) Por Origen o Sector

  • Datos gubernamentales: presupuestos, contrataciones públicas, estadísticas oficiales y legislación.
  • Datos académicos y científicos: resultados de investigaciones financiadas con fondos públicos.
  • Datos privados abiertos: información que las empresas deciden hacer pública por diversos motivos estratégicos.

C) Por Ámbito de Aplicación

  • Datos orientados al gobierno abierto: basados en la comunicación bidireccional entre ciudadanos y gobiernos, entendiendo que los datos son un bien público.
  • Repositorios orientados a la ciencia abierta: fundamentados en el principio de que las investigaciones financiadas con recursos públicos deben ser públicas.

Problemas y Desafíos en la Implementación

A pesar de su potencial transformador, la implementación efectiva de datos abiertos enfrenta diversos retos y limitaciones que deben abordarse para maximizar su valor.

Problemas Técnicos Frecuentes

Según el Barómetro de Datos Abiertos, existen cinco problemas técnicos principales que obstaculizan la publicación efectiva de datos abiertos:

  1. Licencias no abiertas: solo el 18% de los datos publicados están claramente asociados a una licencia abierta. La mayoría tiene licencias restrictivas o desconocidas, impidiendo su reutilización efectiva.
  2. Conjuntos de datos incompletos: únicamente el 32% de los conjuntos de datos digitalizados se publican de forma completa. La mayoría se encuentran fraccionados y diseminados entre múltiples secciones o sitios web, dificultando su localización y aprovechamiento.
  3. Formatos no legibles por máquinas o difícilmente reutilizables: solo el 55% de los datos se publican en formatos legibles por máquinas y fácilmente reutilizables. El uso limitado de formatos estandarizados dificulta la interoperabilidad, y la prevalencia de formatos propietarios restringe el acceso.
  4. Datos desactualizados: hasta un 26% de los datos disponibles no se actualizan con la frecuencia adecuada según su naturaleza. En muchos casos tampoco se indica cuál será la frecuencia de actualización, lo que reduce su utilidad.
  5. Tasas de acceso: para aproximadamente el 10% de los datos publicados es necesario pagar una tasa para obtener acceso completo, lo que limita el público beneficiado y contribuye a aumentar la brecha digital.

Calidad y Persistencia

La calidad de actualización de los portales de datos abiertos es un factor crítico. Es de vital importancia saber analizar los datos correctamente para determinar la calidad de actualización de cada portal y mejorar la visualización de los valores obtenidos de forma que sean entendibles por cualquier usuario.

Existen portales de datos abiertos que no se actualizan periódicamente o presentan errores de persistencia, lo que compromete la fiabilidad y utilidad de la información proporcionada. Para abordar este problema, se han desarrollado herramientas como “semáforos” que determinan en tiempo real la calidad de los datos de APIs específicas, ofreciendo métricas de fiabilidad de actualización que permiten a empresas y usuarios utilizarlas con mayor seguridad.

Implementación Institucional

La adopción efectiva de políticas de datos abiertos requiere un cambio cultural en las instituciones públicas y privadas, así como el desarrollo de capacidades técnicas y marcos regulatorios adecuados. Según los estudios realizados, se observa que:

  • Solo un 40% de las ciudades analizadas en España cuentan con un portal de datos abiertos, y la puntuación media no alcanza el 50% en términos de implementación efectiva.
  • Aunque existan documentos que dan sustento legal a la aplicación de datos abiertos en la Administración pública, se identifican limitadas fuentes oficiales de datos abiertos en áreas críticas como seguridad ciudadana y delincuencia.

Iniciativas y Proyectos Destacados

El ecosistema de datos abiertos se enriquece constantemente con nuevas iniciativas y proyectos que demuestran su potencial y aplicabilidad en diversos contextos.

1. Iniciativas Gubernamentales

  • Datos.gob.es: portal de datos abiertos del Gobierno de España que cuenta con 286 iniciativas de datos abiertos, incluyendo 41 de Administración del Estado, 20 de Administración Autonómica, 210 de Administración Local, 14 de Universidades y 1 de Otras Instituciones.
  • Portal de Datos Europeo: ha publicado estudios como “The Economic Impact of Open Data: Opportunities for value creation in Europe”, que analiza el impacto económico previsto de los datos abiertos en Europa.

2. Proyectos Académicos y Colaborativos

  • UniversiDATA: portal colaborativo de varias universidades públicas que aúna los datos abiertos de estas instituciones en un esfuerzo para lograr mayor eficacia y sencillez para el usuario a través de un mismo acceso, primando la comparabilidad entre instituciones.
  • UniversiDATA-Lab: iniciativa que busca acercar el análisis de datos a todos los usuarios interesados, incluso aquellos sin conocimientos técnicos necesarios para manejar los datos. Ofrece aplicaciones interactivas que permiten realizar análisis de datos abiertos de forma sencilla, dinámica e intuitiva.

3. Aplicaciones Prácticas y Estudios de Caso

  • Minería de datos en datos abiertos de Ecuador: estudio que analiza los datos de delincuencia para identificar patrones delictivos y mejorar la toma de decisiones de organismos competentes, demostrando la utilidad de los datos abiertos en seguridad pública.
  • Semáforo de calidad de datos: herramienta desarrollada para determinar la calidad del dato de la API meteorológica de GRAFCAN, ofreciendo métricas de fiabilidad de actualización que permiten a empresas y usuarios utilizar la API con seguridad.

Tendencias y Perspectivas Futuras

El campo de los datos abiertos continúa evolucionando, presentando nuevas oportunidades y desafíos para su aprovechamiento óptimo.

Integración con Tecnologías Emergentes

La combinación de datos abiertos con tecnologías emergentes como la inteligencia artificial, el aprendizaje automático y el análisis de big data está abriendo nuevas posibilidades para extraer valor de la información disponible. Estas sinergias permiten:

  • Desarrollar modelos predictivos más precisos basados en datos históricos abiertos.
  • Automatizar la detección de patrones y tendencias en grandes volúmenes de datos.
  • Crear visualizaciones interactivas que faciliten la comprensión de información compleja.

Datos Abiertos y Desarrollo Sostenible

Los datos abiertos juegan un papel fundamental en el seguimiento y consecución de los Objetivos de Desarrollo Sostenible (ODS). La disponibilidad de información confiable y actualizada permite:

  • Monitorear el progreso hacia metas específicas.
  • Identificar áreas prioritarias de intervención.
  • Diseñar políticas públicas basadas en evidencia.
  • Fomentar la colaboración internacional en la resolución de desafíos globales.

Desafíos Éticos y de Privacidad

A medida que avanza la adopción de datos abiertos, surgen importantes consideraciones éticas y de privacidad que deben abordarse:

  • Equilibrio entre apertura y protección de datos personales sensibles.
  • Desarrollo de marcos normativos que promuevan la apertura responsable.
  • Implementación de mecanismos de anonimización efectivos que preserven la utilidad de los datos.
  • Educación y sensibilización sobre el uso ético de la información abierta.

Conclusión

Los datos abiertos representan un cambio paradigmático en la forma en que compartimos y utilizamos la información en la era digital, constituyendo un pilar fundamental para la construcción de sociedades más transparentes, innovadoras y participativas. Su potencial transformador se manifiesta en múltiples dimensiones, desde la mejora de la gestión pública y el impulso económico hasta el empoderamiento ciudadano y la colaboración global en la resolución de desafíos comunes.