Nous sommes en 2025, et nous avons atteint le sommet du battage médiatique de la GenAI. Les plateformes financières commercialisent désormais des chatbots et des copilotes durables qui promettent de "démocratiser les informations" ou de "simplifier la conformité". Le potentiel est extraordinaire. Mais il y a une vérité qui dérange : quelle que soit l'intelligence de votre assistant GenAI, il ne peut pas résoudre le plus gros problème de la finance durable : les mauvaises données.
Il ne s'agit pas d'une objection philosophique. Il s'agit d'une objection technique et stratégique. Les grands modèles de langage (LLM) comme GPT sont brillants pour générer des textes cohérents et convaincants, et peuvent être exceptionnellement utiles pour résumer de grands ensembles de données, générer des rapports et automatiser des tâches de routine, en faisant en quelques minutes ce qui prendrait des jours à un analyste humain. Cependant, ils dépendent fortement de la qualité et de la structure des informations qui leur sont fournies. Dans le monde désordonné et aux enjeux considérables des données sur le développement durable, s'appuyer uniquement sur la GenAI sans résoudre le problème des données revient à demander à un architecte de renommée mondiale de construire un gratte-ciel avec des matériaux défectueux : la façade sera peut-être grandiose, mais la structure ne sera pas solide, et elle ne résistera certainement pas à l'épreuve du temps ou ne répondra pas aux besoins de l'industrie.
La finance durable a besoin de plus que de belles paroles
L'urgence de disposer de données solides sur le développement durable est indéniable. Les investisseurs ont besoin de clarté sur les émissions de carbone, l'impact social et les risques de gouvernance. Les entreprises sont confrontées à des exigences réglementaires croissantes, tandis que les parties prenantes expriment de plus en plus clairement leur besoin de transparence et de responsabilité.
Pourtant, le paysage des données reste profondément défectueux. Dans le domaine de la finance durable, la plupart des informations sont autodéclarées, incomplètes, non normalisées ou enfouies dans des PDF et des notes de bas de page. Nos recherches sur le reporting carbone montrent que seulement 60 % des entreprises divulguent des émissions de type Scope 3. Même lorsqu'elles sont divulguées, les définitions varient considérablement : ce qu'une entreprise appelle "utilisation d'énergie renouvelable", une autre peut le catégoriser différemment. Ce manque de normalisation rend les comparaisons difficiles et la confiance difficile à obtenir.
En plus d'être frustrants pour les analystes, ces problèmes affectent directement les décisions d'investissement, les rapports de conformité et la crédibilité de l'ensemble de l'écosystème de la finance durable. Imaginez que vous demandiez à un modèle GenAI de réconcilier les méthodologies qui sous-tendent les émissions Scope 3 de deux multinationales. Il pourrait vous donner une réponse bien formulée, mais comme la qualité de la divulgation des émissions Scope 3 dans le monde entier est encore bien en deçà des normes acceptables - et que certaines régions obtiennent un score aussi bas que 2,2 sur 5 - il n'y a aucun moyen fiable de retracer ou de valider la réponse.
Ce n'est pas ainsi que la GenAI apportera un véritable changement.
Pourquoi même la meilleure IA a besoin d'une base de données solide
Il est facile de se laisser séduire par l'idée que les LLM peuvent résumer, analyser ou expliquer des données à la demande et à une échelle sans précédent. Et c'est le cas, mais seulement lorsque les données brutes sont prêtes. Dans le domaine de la finance durable, la préparation de ces données est un travail complexe et technique : il s'agit d'extraire des informations de PDF à plusieurs colonnes, de rapports scannés et de documents réglementaires multilingues, de vérifier la crédibilité et l'actualité des données et de normaliser les mesures afin qu'elles aient la même signification pour toutes les entreprises et tous les secteurs.
Il s'agit également de saisir les nuances. Les données sur le développement durable se cachent souvent dans les détails : le plan de rémunération d'un PDG lié aux objectifs d'émissions, ou la gravité d'une controverse sur les droits de l'homme enfouie dans une source d'information régionale. Sans ce contexte structuré, GenAI peut produire des résumés généraux, voire élégants dans leur formulation, mais déconnectés des réalités du terrain.
Prenons l'exemple des engagements en matière de climat. En apparence, deux entreprises peuvent prétendre lier la rémunération des dirigeants aux performances environnementales. Mais dans la pratique, l'une peut lier 20 % de la rémunération des dirigeants à la décarbonisation des fournisseurs et à la réduction des émissions, tandis que l'autre n'offre que des promesses vagues et non quantifiées. Si les données sous-jacentes ne sont pas codifiées et vérifiées, l'analyse d'IA traite les deux comme égales - trompant les décideurs avec une équivalence élégamment formulée.
Du chaos des données à la clarté
C'est pourquoi, d'après notre expérience, 80 % de la valeur ajoutée de l'IA dans le domaine de la finance durable se produit avant même que la première demande de LLM ne soit formulée. Prenons l'exemple du suivi des controverses. Les modèles d'IA analysent en permanence le contenu non structuré des sources d'information, des alertes réglementaires et des rapports (souvent en plusieurs langues) pour détecter les catastrophes environnementales potentielles, les violations des droits du travail ou les scandales de gouvernance. Une fois identifiés, les incidents doivent être liés aux bonnes entreprises, classés selon les bonnes mesures de durabilité et se voir attribuer des scores de gravité précis.
Le même défi se pose pour l'extraction d'indicateurs à partir des informations fournies par les entreprises. Les rapports sont des documents tentaculaires remplis de notes de bas de page et de tableaux complexes, rarement exprimés en termes normalisés. Dans ce cas, des systèmes d'IA spécialisés (depuis la reconnaissance optique de caractères (OCR) et l'analyse de la mise en page jusqu'à des modèles affinés formés sur de vastes ensembles de données étiquetées) capturent et structurent les détails bruts, détectant des indicateurs clés de performance spécifiques au développement durable qui, autrement, seraient perdus.
Dans un cas, une entreprise a fait référence à ses avantages sociaux en matière de garde d'enfants de manière indirecte, en décrivant des "jardins d'enfants pour le personnel", des "services de garde d'appoint" et des "bons de crèche". Le rapport n'ayant jamais utilisé l'expression précise "services de garde d'enfants", les annotateurs humains n'ont pas tenu compte de ces passages. Nos outils d'extraction ont toutefois reconnu l'équivalence sémantique et les ont correctement mis en correspondance avec la mesure sociale correspondante. Cette simple étape a permis de remodeler le profil de l'entreprise, révélant un programme de soutien aux employés plus solide que ce que l'on pensait auparavant. Un détail suffisamment petit pour être ignoré, mais suffisamment important pour influencer les décisions d'investissement.
C'est pourquoi chaque point de données doit être étiqueté avec sa provenance - sa source, son horodatage, sa méthode d'extraction et son indice de confiance - afin qu'il puisse être tracé et vérifié. Une fois ces éléments en place, la base de l'IA devient fiable. Ce n'est qu'à ce moment-là que la GenAI peut être véritablement transformatrice : elle fournit des informations qui sont non seulement précises et vérifiables, mais aussi plus rapides à générer et plus intelligentes sur le plan contextuel. Sans cette base, l'IA générique fonctionne dans l'obscurité.
L'engouement pour la GenAI nous détourne de la véritable innovation
La véritable révolution dans le domaine de la finance durable ne viendra pas de l'intégration de ChatGPT dans un tableau de bord. Elle viendra de la résolution du problème sale et ingrat de l'infrastructure de données, de la construction de pipelines capables de prendre des données brutes, non structurées, multilingues et souvent contradictoires, et de les transformer en résultats fiables, utilisables et exploitables.
Une fois cela en place, les systèmes d'IA peuvent générer les données vérifiées, et GenAI peut alors les amplifier, créant des rapports, des informations et des analyses à grande vitesse et à grande échelle, améliorant ainsi considérablement l'efficacité pour les investisseurs, les régulateurs et les entreprises. La voie à suivre est celle d'une IA judicieuse : pas seulement de grands modèles, mais des modèles intelligents, conçus spécialement pour la durabilité, équilibrant la précision, l'efficacité et la rentabilité.
Dans le domaine de la finance durable, la technologie tape-à-l'œil ne fera pas avancer les choses. Ce sont les données fiables qui le feront.




