Datos: ¿La infraestructura pública del futuro?

Por

Por

Por Fernando Fernandez-Monge | Firma invitada*

Por

Fecha de publicación
9/6/25
Compartir

Datos: ¿La infraestructura pública del futuro?

Pueden serlo, pero su tratamiento depende del objetivo que se persiga.

Hace unos días, en el congreso GovTech4Impact en Madrid, me encontré con buenos amigos, y mejores expertos: Dan Abadie, Aura Cifuentes, Mara Balestrini... Escucharles hizo que me volviera a la cabeza una pregunta que me ronda desde hace tiempo: ¿podemos decir que los datos son una infraestructura pública?

La respuesta, como suele ocurrir con las grandes preguntas, no es un simple sí o no, sino un "depende".

Empezando por lo básico, ¿por qué importa esta pregunta?

No solo por un interés más o menos académico. Si decimos, y decidimos, que ciertos datos son una infraestructura pública, debemos asumir que esa calificación tiene consecuencias:

  1. Inversión y Beneficios Compartidos: Las infraestructuras (como carreteras o redes eléctricas) requieren grandes inversiones iniciales. A cambio, generan beneficios que se extienden a toda la sociedad, aunque quien las construye no siempre pueda monetizar directamente todos esos beneficios. Si ciertos datos son infraestructura, podríamos necesitar la intervención pública para asegurar que se invierte lo suficiente en generarlos.
  2. Fiabilidad y Disponibilidad Constante: Si dependemos de ciertos datos para el funcionamiento de servicios esenciales –pensemos en la información sobre oferta y demanda de energía en tiempo real que se necesita para poder gestionar la red eléctrica–, debemos garantizar que sean fiables y estén siempre disponibles.
  3. Acceso Equitativo: Como las infraestructuras son la base sobre la que se construyen muchos otros servicios y actividades, es fundamental que sean accesibles (que no necesariamente abiertos).

Algunos rasgos que hacen los datos comparables a una infraestructura

Definir qué es una "infraestructura" es un reto. Aplicarla al mundo digital y añadirle el calificativo de "pública" lo complica aún más. Mariana Mazzucato, Dave Eaves y Beatriz Vaconcellos han desarrollado estos conceptos en varios artículos (ver por ejemplo aquí y aquí), y recomiendo su lectura a quien quiera profundizar en el tema.

Aquí nos basta con decir que hay al menos cinco características para que ciertos datos funcionen como una infraestructura:

Característica ¿Qué implica?
No rivalidad Su uso por una persona no impide que otras también lo usen al mismo tiempo (el mismo dato sirve a muchos).
Externalidades positivas Generan ventajas indirectas para muchos actores y para la sociedad en general.
Altos costes de inversión inicial Crearlos y mantenerlos requiere un esfuerzo económico y técnico considerable.
Riesgos sistémicos Si fallan o son incorrectos, pueden causar problemas graves en cadena.
Necesidad de neutralidad y confianza Deben ser gestionados de forma imparcial y generar confianza en su veracidad.

Pensemos en el catastro o el registro de la propiedad. Estas bases de datos cumplen con todos estos rasgos. Por eso, es el Gobierno quien generalmente recoge, gestiona y regula el acceso a esta "fuente única de verdad". Aunque algunas partes de la gestión de estos registros se pueda subcontratar, el control último sobre los datos y sus reglas de acceso es responsabilidad gubernamental. 

Otro ejemplo: la localización en tiempo real del transporte público. A diferencia de los anteriores, estos datos surgen como un producto derivado de la prestación del servicio de transporte, pero también pueden servir como una infraestructura pública que beneficia a ciudadanos, desarrolladores de aplicaciones y planificadores urbanos.

¿Y los datos recolectados por empresas? También pueden ser infraestructura

El tema es que no solo los datos gestionados por el Gobierno pueden tener estas características. Hay conjuntos de datos recopilados por empresas privadas que también tienen estos rasgos.

Tomemos el caso de Experian, una agencia de informes de crédito. Experian recopila información sobre más de mil millones de personas y empresas, datos que luego son utilizados por bancos y otras instituciones para tomar decisiones crediticias. Veamos si estos datos también tienen los 5 rasgos “infraestructurales”:

  • No rivalidad: Varios bancos o prestamistas pueden consultar el mismo informe de crédito sin "gastarlo".
  • Externalidades positivas: Un informe de crédito preciso reduce el riesgo para las entidades financieras, puede abaratar el crédito y agilizar procesos de alquiler o contratación.
  • Altos costes de inversión: Construir estos historiales a nivel nacional lleva décadas y requiere procesos complejos y costosos.
  • Riesgo sistémico: Un error grave en los datos de Experian podría paralizar la concesión de créditos y afectar a la economía.
  • Necesidad de neutralidad y confianza: Los algoritmos y procesos de estas empresas tienen que ser transparentes, auditables y no discriminatorios.

Precisamente por esta necesidad de neutralidad y su rol “sistémico”, estos datos están sujetos a regulación. El Gobierno interviene a través de leyes (como la Fair Credit Reporting Act en EE.UU.) que imponen normas sobre su precisión, auditabilidad, no discriminación y acceso, similar a lo que ocurre en otros sectores críticos y regulados en la economía.

Cuando lo esencial es que los datos fluyan

A veces, el valor público no reside tanto en una base de datos específica (el "activo"), sino en su circulación fluida entre diferentes entidades. En estos casos, el objetivo del Gobierno es facilitar este flujo, estableciendo reglas de interoperabilidad (para que los sistemas "hablen" entre sí), estándares y, a veces, obligaciones de compartir datos mediante APIs (protocolos que permiten que diferentes sistemas puedan comunicarse).

¿Para qué? Para fomentar algunos beneficios de ese intercambio de datos, como la innovación, o para evitar que unas pocas entidades acaparen todos los datos de un sector, limitando la competencia. Este es el objetivo del Data Act europeo. En otros casos, la circulación de esos datos facilita objetivos públicos como la mejor gestión del transporte. La nueva regulación de la UE sobre datos de tráfico y seguridad en tiempo real busca precisamente garantizar este flujo para mejorar la seguridad y sostenibilidad del transporte.

Para que los datos fluyan, el Gobierno puede gestionar directamente la capa tecnológica (las "tuberías" por las que circulan esos datos), como la famosa plataforma X-Road de Estonia u otros mecanismos de intercambio de datos (data exchanges). Sin embargo, no siempre es necesario que el Gobierno sea el dueño de estas "tuberías". Usando la analogía del Stack de Dave Eaves, podríamos imaginar los datos en sí mismos (datos como activo) en la base, y el flujo de esos datos como una capa intermedia esencial para conectar y generar valor.

"Infraestructura de datos" no significa "datos abiertos" 

Una aclaración importante: llamar a algunos datos "infraestructura pública" no implica automáticamente que deban ser de libre acceso. Podemos querer proteger ciertos datos por su papel crítico, pero la decisión sobre quién accede a ellos y bajo qué condiciones requiere considerar otros factores: los costes de producirlos y abrirlos, los riesgos para la privacidad, o el impacto en la competencia y el valor público.

Un conjunto de datos puede ser infraestructural y tener un acceso restringido (como los datos de la red eléctrica), mientras que otros datos pueden no ser infraestructurales y ser completamente abiertos (como los datos agregados de bicicletas compartidas en una ciudad).

Diferentes roles del Gobierno para diferentes objetivos

No todos los datos son iguales, así que no hay una única forma de gestionar los activos o flujos de datos que consideramos infraestructuras públicas.

El Gobierno juega ocho roles distintos, dependiendo de los objetivos que se persigan. Imaginemos un cuadro con dos ejes:

  • Eje Vertical - Objetivo Público: ¿Qué queremos lograr? ¿Mantener la precisión del dato? ¿Facilitar su acceso? ¿Asegurar que existan "tuberías" comunes para su circulación? ¿O mantener esas tuberías funcionando correctamente?
  • Eje Horizontal - Actor Principal: ¿Quién debe liderar para alcanzar ese objetivo? ¿El Gobierno directamente, o un actor privado bajo un marco regulatorio?

¿Cuál es el objetivo público? Actor Principal – Sector Público
El Gobierno posee y/o gestiona el activo o la capa tecnológica
Actor Principal – Sector Privado
El Gobierno regula o contrata con el propietario u operador
Veracidad del activo (los datos) Establecer y gestionar un registro oficial. Ejemplo: El catastro y el registro de la propiedad mantienen actualizados los límites parcelarios, valores catastrales, títulos de propiedad y garantías reales. Establecer normas de auditoría de calidad de datos. Ejemplo: Los datos de las agencias de crédito son auditados según las leyes de crédito al consumo para verificar tasas de error y no discriminación.
Acceso al activo (los datos) Publicar bajo licencia de datos abiertos y con una API gratuita. Ejemplo: La Plataforma de Datos de Hamburgo publica microdatos de acceso abierto. Imponer obligaciones de acceso masivo o condiciones FRAND. Ejemplo: Normativas de la UE que exigen el intercambio de datos de Tráfico y Seguridad bajo condiciones FRAND.
Garantía del flujo de datos sin gestionar directamente las “tuberías” Invertir en el desarrollo y la gestión de estándares y APIs. Ejemplo: Promoción y reconocimiento gubernamental de los estándares NeTEx para asegurar el intercambio de datos de transporte público a través de Puntos de Acceso Nacionales. Establecer estándares de interoperabilidad y un mandato de API abierta. Ejemplo: Desarrollo de estándares de movilidad MDS y mandatos de intercambio de datos. Participación pública y privada a través de la Open Mobility Foundation.
Gestión directa de las 'tuberías' para garantizar el flujo de datos Gestionar una infraestructura pública. Ejemplo: La plataforma X-Road de Estonia garantiza la disponibilidad en todos los intercambios de datos entre organismos estatales. Designar como “servicio esencial” y exigir planes de redundancia. Ejemplo: Red SWIFT. Privada pero supervisada por bancos centrales y reguladores de ciberseguridad.

La posición de una base de datos o un flujo de datos en este "mapa" nos ayuda a pensar de forma más precisa cómo debe intervenir el Gobierno.

¿Y entonces, son o no son los datos una infraestructura pública?

Sí, lo pueden ser. Lo importante, sin embargo, es que definir ciertos datos como una "infraestructura pública" es solo un primer diagnóstico. La clave está en identificar el tratamiento: qué tipo de intervención (gestión directa o supervisión regulatoria) se necesita. Para eso hay que tener claro cuál es el objetivo y dónde está el posible “atasco”: ¿en la disponibilidad y calidad del conjunto de datos en sí, o en las "tuberías" que permiten su circulación y aprovechamiento?

*Firma invitada: Fernando Fernandez-Monge

Senior Associate | Bloomberg-Harvard City Leadership Initiative

Este artículo se publicó originalmente en inglés en Datapolis. Lea el artículo aquí.

No items found.

Recibe el mejor contenido sobre transformación digital pública y govtech en español.

¡Muchas gracias por suscribirte!
Algo ha salido mal, por favor contacta con nosotros por otro medio.