Estamos en 2025 y hemos alcanzado el punto álgido de la GenAI. Las plataformas financieras ahora comercializan chatbots y copilotos de sostenibilidad que prometen "democratizar los conocimientos" o "simplificar el cumplimiento." El potencial es extraordinario. Pero hay una verdad incómoda: no importa lo inteligente que sea tu asistente GenAI, no puede solucionar el mayor problema de las finanzas sostenibles: los malos datos.
No es una objeción filosófica. Es una objeción técnica y estratégica. Los grandes modelos lingüísticos (LLM) como GPT son brillantes a la hora de generar textos coherentes y convincentes, y pueden ser excepcionalmente útiles para resumir grandes conjuntos de datos, generar informes y automatizar tareas rutinarias, haciendo en minutos lo que a un analista humano le llevaría días. Sin embargo, dependen en gran medida de la calidad y la estructura de la información que reciben. En el desordenado y arriesgado mundo de los datos sobre sostenibilidad, confiar únicamente en la GenAI sin abordar el problema de los datos es como pedir a un arquitecto de talla mundial que construya un rascacielos con materiales defectuosos: la fachada puede ser grandiosa, pero la estructura no será sólida y, desde luego, no resistirá el paso del tiempo ni satisfará las necesidades del sector.
Las finanzas sostenibles necesitan algo más que palabras pulidas
La urgencia de disponer de datos sólidos sobre sostenibilidad es innegable. Los inversores necesitan claridad sobre las emisiones de carbono, el impacto social y los riesgos de gobernanza. Las empresas se enfrentan a exigencias normativas cada vez mayores, mientras que las partes interesadas reclaman cada vez más transparencia y rendición de cuentas.
Sin embargo, el panorama de los datos sigue siendo muy deficiente. En las finanzas sostenibles, gran parte de la información es autodeclarada, incompleta, no normalizada o enterrada en PDF y notas a pie de página. Nuestra investigación sobre los informes de carbono muestra que sólo el 60% de las empresas revelan las emisiones de Alcance 3. Incluso cuando se revelan, las definiciones varían mucho. Incluso cuando se revelan, las definiciones varían mucho: lo que una empresa llama "uso de energía renovable", otra puede categorizarlo de forma diferente. Esta falta de normalización dificulta las comparaciones y la confianza.
Más allá de ser frustrantes para los analistas, estos problemas afectan directamente a las decisiones de inversión, a los informes de cumplimiento y a la credibilidad de todo el ecosistema de las finanzas sostenibles. Imagínese que le pide a un modelo GenAI que concilie las metodologías detrás de las emisiones de Alcance 3 de dos multinacionales. Puede que le dé una respuesta bien formulada, pero con la calidad de la divulgación del Alcance 3 en todo el mundo todavía muy por debajo de los estándares aceptables -y algunas regiones con una puntuación tan baja como 2,2 sobre 5- no hay forma fiable de rastrear o validar la respuesta.
No es así como GenAI aportará un cambio real.
Por qué incluso la mejor IA necesita una base de datos sólida
Es fácil dejarse seducir por la idea de que los LLM pueden resumir, analizar o explicar datos bajo demanda y a una escala sin precedentes. Y pueden hacerlo, pero sólo cuando los datos en bruto están listos. En las finanzas sostenibles, la preparación de esos datos es un trabajo complejo y técnico: extraer información de archivos PDF de varias columnas, informes escaneados y documentos normativos multilingües; verificar la credibilidad y la puntualidad; y estandarizar las métricas para que signifiquen lo mismo en todas las empresas y sectores.
También se trata de captar los matices. Los datos sobre sostenibilidad suelen esconderse en los detalles: el plan de retribución de un consejero delegado vinculado a los objetivos de emisiones, o la gravedad de una controversia sobre derechos humanos enterrada en una fuente de noticias regional. Sin ese contexto estructurado, GenAI puede producir resúmenes amplios e incluso elegantes, pero desconectados de la realidad sobre el terreno.
Tomemos como ejemplo los compromisos climáticos. A primera vista, dos empresas pueden afirmar que "vinculan la remuneración de los ejecutivos a los resultados medioambientales". Pero en la práctica, una puede vincular el 20% de la remuneración de los directivos a la descarbonización de los proveedores y a la reducción de emisiones, mientras que la otra sólo ofrece promesas vagas y sin cuantificar. Si los datos subyacentes no se codifican y verifican, el análisis de IA trata a ambas como iguales, engañando a los responsables de la toma de decisiones con una equivalencia elegantemente redactada.
Del caos de datos a la claridad
Por eso, según nuestra experiencia, el 80% del valor que aporta la IA a las finanzas sostenibles se produce antes incluso de que se invoque la primera indicación del LLM. Por ejemplo, el seguimiento de controversias. Los modelos de IA analizan continuamente contenidos no estructurados de fuentes de noticias, alertas normativas e informes (a menudo en varios idiomas) para detectar posibles desastres medioambientales, violaciones de los derechos laborales o escándalos de gobernanza. Una vez identificados, los incidentes deben vincularse a las empresas correctas, clasificarse según las métricas de sostenibilidad adecuadas y asignarse puntuaciones de gravedad precisas.
El mismo reto se plantea a la hora de extraer métricas de la información empresarial. Los informes son documentos extensos llenos de notas a pie de página y tablas complejas, que rara vez se expresan en términos estandarizados. En este caso, los sistemas especializados de IA (desde el reconocimiento óptico de caracteres (OCR) avanzado y el análisis sintáctico del diseño hasta los modelos perfeccionados entrenados en grandes conjuntos de datos etiquetados) capturan y estructuran los detalles en bruto, detectando KPI específicos de sostenibilidad que, de otro modo, se perderían.
En un caso, una empresa se refirió a sus prestaciones de guardería para empleados de forma oblicua, describiendo "guarderías de plantilla", "guarderías de refuerzo" y "vales de guardería". Como el informe nunca utilizaba la expresión exacta "servicios de guardería", los anotadores humanos habían pasado por alto estos pasajes. Sin embargo, nuestras herramientas de extracción reconocieron la equivalencia semántica y los asignaron correctamente a la métrica social pertinente. Ese único paso reconfiguró el perfil de la empresa, revelando un programa de apoyo a los empleados más sólido de lo que se suponía. Un detalle lo bastante pequeño como para saltárselo, pero lo bastante importante como para influir en las decisiones de inversión.
Por eso, cada punto de datos debe etiquetarse con su procedencia (fuente, fecha y hora, método de extracción y puntuación de confianza) para que pueda rastrearse y verificarse. De este modo, la base de la IA es fiable. Sólo entonces la GenAI podrá ser verdaderamente transformadora: proporcionando información no sólo precisa y auditable, sino también más rápida de generar y más inteligente desde el punto de vista contextual. Sin esa base, GenAI opera en la oscuridad.
El bombo de la GenAI nos distrae de la innovación real
La verdadera revolución de las finanzas sostenibles no vendrá de conectar ChatGPT a un panel de control. Vendrá de resolver el sucio y poco sexy problema de la infraestructura de datos de construir conductos que puedan tomar datos en bruto, no estructurados, multilingües y a menudo contradictorios, y convertirlos en resultados fiables, utilizables y procesables.
Una vez establecido esto, los sistemas de IA pueden generar las entradas verificadas, y GenAI puede amplificarlas, creando informes, perspectivas y análisis a velocidad y escala, mejorando drásticamente la eficiencia para inversores, reguladores y empresas por igual. El camino a seguir es una IA sensata: no sólo grandes modelos, sino modelos inteligentes, creados específicamente para la sostenibilidad, que equilibren precisión, eficiencia y rentabilidad.
En las finanzas sostenibles, la tecnología llamativa no moverá la aguja. Lo harán los datos fiables.




