GenAI no salvará las finanzas sostenibles a menos que primero arreglemos los datos

Publicado: 4 de noviembre de 2025

Modificado: 21 de noviembre de 2025

Principales conclusiones

La GenAI sólo puede ser eficaz en las finanzas sostenibles si los datos subyacentes son precisos, estructurados y normalizados.
En la actualidad, los datos sobre sostenibilidad son fragmentarios, incoherentes y, a menudo, incompletos, lo que hace imposible que los LLM generen perspectivas fiables.
La mayor parte del valor de la IA en las finanzas sostenibles procede del trabajo fundacional de extracción, verificación y estructuración de la información en bruto, no de la capa final de GenAI.
Sin procedencia, validación y contexto, los resultados de la GenAI corren el riesgo de parecer convincentes y, al mismo tiempo, ser fundamentalmente erróneos.
El verdadero avance vendrá de la reconstrucción de la infraestructura de datos para que GenAI pueda operar con información fiable y auditable a escala.

Estamos en 2025 y hemos alcanzado el punto álgido de la GenAI. Las plataformas financieras ahora comercializan chatbots y copilotos de sostenibilidad que prometen "democratizar los conocimientos" o "simplificar el cumplimiento." El potencial es extraordinario. Pero hay una verdad incómoda: no importa lo inteligente que sea tu asistente GenAI, no puede solucionar el mayor problema de las finanzas sostenibles: los malos datos.

No es una objeción filosófica. Es una objeción técnica y estratégica. Los grandes modelos lingüísticos (LLM) como GPT son brillantes a la hora de generar textos coherentes y convincentes, y pueden ser excepcionalmente útiles para resumir grandes conjuntos de datos, generar informes y automatizar tareas rutinarias, haciendo en minutos lo que a un analista humano le llevaría días. Sin embargo, dependen en gran medida de la calidad y la estructura de la información que reciben. En el desordenado y arriesgado mundo de los datos sobre sostenibilidad, confiar únicamente en la GenAI sin abordar el problema de los datos es como pedir a un arquitecto de talla mundial que construya un rascacielos con materiales defectuosos: la fachada puede ser grandiosa, pero la estructura no será sólida y, desde luego, no resistirá el paso del tiempo ni satisfará las necesidades del sector.

Las finanzas sostenibles necesitan algo más que palabras pulidas

La urgencia de disponer de datos sólidos sobre sostenibilidad es innegable. Los inversores necesitan claridad sobre las emisiones de carbono, el impacto social y los riesgos de gobernanza. Las empresas se enfrentan a exigencias normativas cada vez mayores, mientras que las partes interesadas reclaman cada vez más transparencia y rendición de cuentas.

Sin embargo, el panorama de los datos sigue siendo muy deficiente. En las finanzas sostenibles, gran parte de la información es autodeclarada, incompleta, no normalizada o enterrada en PDF y notas a pie de página. Nuestra investigación sobre los informes de carbono muestra que sólo el 60% de las empresas revelan las emisiones de Alcance 3. Incluso cuando se revelan, las definiciones varían mucho. Incluso cuando se revelan, las definiciones varían mucho: lo que una empresa llama "uso de energía renovable", otra puede categorizarlo de forma diferente. Esta falta de normalización dificulta las comparaciones y la confianza.

Más allá de ser frustrantes para los analistas, estos problemas afectan directamente a las decisiones de inversión, a los informes de cumplimiento y a la credibilidad de todo el ecosistema de las finanzas sostenibles. Imagínese que le pide a un modelo GenAI que concilie las metodologías detrás de las emisiones de Alcance 3 de dos multinacionales. Puede que le dé una respuesta bien formulada, pero con la calidad de la divulgación del Alcance 3 en todo el mundo todavía muy por debajo de los estándares aceptables -y algunas regiones con una puntuación tan baja como 2,2 sobre 5- no hay forma fiable de rastrear o validar la respuesta.

No es así como GenAI aportará un cambio real.

Por qué incluso la mejor IA necesita una base de datos sólida

Es fácil dejarse seducir por la idea de que los LLM pueden resumir, analizar o explicar datos bajo demanda y a una escala sin precedentes. Y pueden hacerlo, pero sólo cuando los datos en bruto están listos. En las finanzas sostenibles, la preparación de esos datos es un trabajo complejo y técnico: extraer información de archivos PDF de varias columnas, informes escaneados y documentos normativos multilingües; verificar la credibilidad y la puntualidad; y estandarizar las métricas para que signifiquen lo mismo en todas las empresas y sectores.

También se trata de captar los matices. Los datos sobre sostenibilidad suelen esconderse en los detalles: el plan de retribución de un consejero delegado vinculado a los objetivos de emisiones, o la gravedad de una controversia sobre derechos humanos enterrada en una fuente de noticias regional. Sin ese contexto estructurado, GenAI puede producir resúmenes amplios e incluso elegantes, pero desconectados de la realidad sobre el terreno.

Tomemos como ejemplo los compromisos climáticos. A primera vista, dos empresas pueden afirmar que "vinculan la remuneración de los ejecutivos a los resultados medioambientales". Pero en la práctica, una puede vincular el 20% de la remuneración de los directivos a la descarbonización de los proveedores y a la reducción de emisiones, mientras que la otra sólo ofrece promesas vagas y sin cuantificar. Si los datos subyacentes no se codifican y verifican, el análisis de IA trata a ambas como iguales, engañando a los responsables de la toma de decisiones con una equivalencia elegantemente redactada.

Del caos de datos a la claridad

Por eso, según nuestra experiencia, el 80% del valor que aporta la IA a las finanzas sostenibles se produce antes incluso de que se invoque la primera indicación del LLM. Por ejemplo, el seguimiento de controversias. Los modelos de IA analizan continuamente contenidos no estructurados de fuentes de noticias, alertas normativas e informes (a menudo en varios idiomas) para detectar posibles desastres medioambientales, violaciones de los derechos laborales o escándalos de gobernanza. Una vez identificados, los incidentes deben vincularse a las empresas correctas, clasificarse según las métricas de sostenibilidad adecuadas y asignarse puntuaciones de gravedad precisas.

El mismo reto se plantea a la hora de extraer métricas de la información empresarial. Los informes son documentos extensos llenos de notas a pie de página y tablas complejas, que rara vez se expresan en términos estandarizados. En este caso, los sistemas especializados de IA (desde el reconocimiento óptico de caracteres (OCR) avanzado y el análisis sintáctico del diseño hasta los modelos perfeccionados entrenados en grandes conjuntos de datos etiquetados) capturan y estructuran los detalles en bruto, detectando KPI específicos de sostenibilidad que, de otro modo, se perderían.

En un caso, una empresa se refirió a sus prestaciones de guardería para empleados de forma oblicua, describiendo "guarderías de plantilla", "guarderías de refuerzo" y "vales de guardería". Como el informe nunca utilizaba la expresión exacta "servicios de guardería", los anotadores humanos habían pasado por alto estos pasajes. Sin embargo, nuestras herramientas de extracción reconocieron la equivalencia semántica y los asignaron correctamente a la métrica social pertinente. Ese único paso reconfiguró el perfil de la empresa, revelando un programa de apoyo a los empleados más sólido de lo que se suponía. Un detalle lo bastante pequeño como para saltárselo, pero lo bastante importante como para influir en las decisiones de inversión.

Por eso, cada punto de datos debe etiquetarse con su procedencia (fuente, fecha y hora, método de extracción y puntuación de confianza) para que pueda rastrearse y verificarse. De este modo, la base de la IA es fiable. Sólo entonces la GenAI podrá ser verdaderamente transformadora: proporcionando información no sólo precisa y auditable, sino también más rápida de generar y más inteligente desde el punto de vista contextual. Sin esa base, GenAI opera en la oscuridad.

El bombo de la GenAI nos distrae de la innovación real

La verdadera revolución de las finanzas sostenibles no vendrá de conectar ChatGPT a un panel de control. Vendrá de resolver el sucio y poco sexy problema de la infraestructura de datos de construir conductos que puedan tomar datos en bruto, no estructurados, multilingües y a menudo contradictorios, y convertirlos en resultados fiables, utilizables y procesables.

Una vez establecido esto, los sistemas de IA pueden generar las entradas verificadas, y GenAI puede amplificarlas, creando informes, perspectivas y análisis a velocidad y escala, mejorando drásticamente la eficiencia para inversores, reguladores y empresas por igual. El camino a seguir es una IA sensata: no sólo grandes modelos, sino modelos inteligentes, creados específicamente para la sostenibilidad, que equilibren precisión, eficiencia y rentabilidad.

En las finanzas sostenibles, la tecnología llamativa no moverá la aguja. Lo harán los datos fiables.

Información sobre el autor

Marsal Gavaldà

Director de Tecnología, Clarity AI

Marsal es un alto ejecutivo de ingeniería con gran experiencia en el habla, el lenguaje y el aprendizaje automático. Crea equipos de ingeniería centrados en los datos, impulsa la innovación de productos y organiza una cumbre anual sobre ciencia y cultura en la que se exploran temas que van desde la traducción automática a la neurociencia.

Investigación y conocimientos

Últimas noticias y artículos

Perspectivas del mercado

Cómo están afrontando los inversores el riesgo geopolítico

El riesgo geopolítico siempre se ha tenido en cuenta a la hora de tomar decisiones de inversión, pero rara vez ha obligado a replantearse los supuestos en los que se basan. Hoy en día, sí lo hace. La cuestión a la que se enfrentan los inversores a largo plazo ya no es si los acontecimientos geopolíticos influyen en los mercados, sino si los marcos elaborados a lo largo de décadas para orientar la construcción de carteras, la política de exclusión y la asignación de activos siguen siendo…

Leer el artículo

Riesgo ESG, igualdad de género

La brecha entre lo que se dice y lo que se hace en materia de diversidad: dos tercios de las empresas que han cometido infracciones por discriminación también afirman llevar a cabo iniciativas de diversidad

Junio es un mes en el que las comunicaciones corporativas se llenan de mensajes sobre el Orgullo, compromisos con la diversidad y declaraciones sobre la inclusión. Pero más allá de la visibilidad de estas declaraciones, sigue planteándose una cuestión más compleja: ¿se ajustan estos compromisos de forma coherente a la conducta real de las empresas? En Clarity AI, hemos analizado si las empresas que se ven envueltas en polémicas por discriminación en la práctica también hacen hincapié públicamente en…

Leer el artículo

Clima

La brecha en materia de riesgos físicos: lo que no recogen los conjuntos de datos actuales

El acceso a los datos sobre riesgos físicos ya no es un problema. La mayoría de los gestores de activos que los necesitan disponen de ellos. Sin embargo, son muchos menos los que cuentan con datos que se mantengan sólidos cuando realmente importa: ante el escrutinio regulatorio, en los informes para los clientes o a la hora de actuar en consecuencia. Este evento tiene lugar en plena temporada de la «semana del clima», tras las ediciones de Zúrich y Londres,…

Leer el artículo

Hable con un experto

GenAI no salvará las finanzas sostenibles a menos que primero arreglemos los datos

Las finanzas sostenibles necesitan algo más que palabras pulidas

Por qué incluso la mejor IA necesita una base de datos sólida

Del caos de datos a la claridad

El bombo de la GenAI nos distrae de la innovación real

Información sobre el autor

Investigación y conocimientos

Cómo están afrontando los inversores el riesgo geopolítico

La brecha entre lo que se dice y lo que se hace en materia de diversidad: dos tercios de las empresas que han cometido infracciones por discriminación también afirman llevar a cabo iniciativas de diversidad

La brecha en materia de riesgos físicos: lo que no recogen los conjuntos de datos actuales

Descargar el recurso