Investir à l'ère de l'IA
IA, Qualité des donnéesArticles

La GenAI ne sauvera pas la finance durable si nous ne corrigeons pas d'abord les données

Publié : 4 novembre 2025
Modifié : 21 novembre 2025
Principaux enseignements
  • La GenAI ne peut être efficace dans le domaine de la finance durable que si les données sous-jacentes sont précises, structurées et normalisées.
  • Les données sur le développement durable sont aujourd'hui fragmentées, incohérentes et souvent incomplètes, ce qui empêche les gestionnaires de l'apprentissage tout au long de la vie de produire des informations fiables.
  • La plus grande partie de la valeur de l'IA dans la finance durable provient du travail fondamental d'extraction, de vérification et de structuration des informations brutes, et non de la couche finale de GenAI.
  • Sans provenance, validation et contexte, les résultats de la GenAI risquent de paraître convaincants tout en étant fondamentalement erronés.
  • La véritable percée viendra de la reconstruction de l'infrastructure des données afin que la GenAI puisse fonctionner sur des informations fiables et vérifiables à grande échelle.

Nous sommes en 2025, et nous avons atteint le sommet du battage médiatique de la GenAI. Les plateformes financières commercialisent désormais des chatbots et des copilotes durables qui promettent de "démocratiser les informations" ou de "simplifier la conformité". Le potentiel est extraordinaire. Mais il y a une vérité qui dérange : quelle que soit l'intelligence de votre assistant GenAI, il ne peut pas résoudre le plus gros problème de la finance durable : les mauvaises données.

Il ne s'agit pas d'une objection philosophique. Il s'agit d'une objection technique et stratégique. Les grands modèles de langage (LLM) comme GPT sont brillants pour générer des textes cohérents et convaincants, et peuvent être exceptionnellement utiles pour résumer de grands ensembles de données, générer des rapports et automatiser des tâches de routine, en faisant en quelques minutes ce qui prendrait des jours à un analyste humain. Cependant, ils dépendent fortement de la qualité et de la structure des informations qui leur sont fournies. Dans le monde désordonné et aux enjeux considérables des données sur le développement durable, s'appuyer uniquement sur la GenAI sans résoudre le problème des données revient à demander à un architecte de renommée mondiale de construire un gratte-ciel avec des matériaux défectueux : la façade sera peut-être grandiose, mais la structure ne sera pas solide, et elle ne résistera certainement pas à l'épreuve du temps ou ne répondra pas aux besoins de l'industrie.

La finance durable a besoin de plus que de belles paroles

L'urgence de disposer de données solides sur le développement durable est indéniable. Les investisseurs ont besoin de clarté sur les émissions de carbone, l'impact social et les risques de gouvernance. Les entreprises sont confrontées à des exigences réglementaires croissantes, tandis que les parties prenantes expriment de plus en plus clairement leur besoin de transparence et de responsabilité.

Pourtant, le paysage des données reste profondément défectueux. Dans le domaine de la finance durable, la plupart des informations sont autodéclarées, incomplètes, non normalisées ou enfouies dans des PDF et des notes de bas de page. Nos recherches sur le reporting carbone montrent que seulement 60 % des entreprises divulguent des émissions de type Scope 3. Même lorsqu'elles sont divulguées, les définitions varient considérablement : ce qu'une entreprise appelle "utilisation d'énergie renouvelable", une autre peut le catégoriser différemment. Ce manque de normalisation rend les comparaisons difficiles et la confiance difficile à obtenir.

En plus d'être frustrants pour les analystes, ces problèmes affectent directement les décisions d'investissement, les rapports de conformité et la crédibilité de l'ensemble de l'écosystème de la finance durable. Imaginez que vous demandiez à un modèle GenAI de réconcilier les méthodologies qui sous-tendent les émissions Scope 3 de deux multinationales. Il pourrait vous donner une réponse bien formulée, mais comme la qualité de la divulgation des émissions Scope 3 dans le monde entier est encore bien en deçà des normes acceptables - et que certaines régions obtiennent un score aussi bas que 2,2 sur 5 - il n'y a aucun moyen fiable de retracer ou de valider la réponse.

Ce n'est pas ainsi que la GenAI apportera un véritable changement.

Pourquoi même la meilleure IA a besoin d'une base de données solide

Il est facile de se laisser séduire par l'idée que les LLM peuvent résumer, analyser ou expliquer des données à la demande et à une échelle sans précédent. Et c'est le cas, mais seulement lorsque les données brutes sont prêtes. Dans le domaine de la finance durable, la préparation de ces données est un travail complexe et technique : il s'agit d'extraire des informations de PDF à plusieurs colonnes, de rapports scannés et de documents réglementaires multilingues, de vérifier la crédibilité et l'actualité des données et de normaliser les mesures afin qu'elles aient la même signification pour toutes les entreprises et tous les secteurs.

Il s'agit également de saisir les nuances. Les données sur le développement durable se cachent souvent dans les détails : le plan de rémunération d'un PDG lié aux objectifs d'émissions, ou la gravité d'une controverse sur les droits de l'homme enfouie dans une source d'information régionale. Sans ce contexte structuré, GenAI peut produire des résumés généraux, voire élégants dans leur formulation, mais déconnectés des réalités du terrain.

Prenons l'exemple des engagements en matière de climat. En apparence, deux entreprises peuvent prétendre lier la rémunération des dirigeants aux performances environnementales. Mais dans la pratique, l'une peut lier 20 % de la rémunération des dirigeants à la décarbonisation des fournisseurs et à la réduction des émissions, tandis que l'autre n'offre que des promesses vagues et non quantifiées. Si les données sous-jacentes ne sont pas codifiées et vérifiées, l'analyse d'IA traite les deux comme égales - trompant les décideurs avec une équivalence élégamment formulée.

Du chaos des données à la clarté

C'est pourquoi, d'après notre expérience, 80 % de la valeur ajoutée de l'IA dans le domaine de la finance durable se produit avant même que la première demande de LLM ne soit formulée. Prenons l'exemple du suivi des controverses. Les modèles d'IA analysent en permanence le contenu non structuré des sources d'information, des alertes réglementaires et des rapports (souvent en plusieurs langues) pour détecter les catastrophes environnementales potentielles, les violations des droits du travail ou les scandales de gouvernance. Une fois identifiés, les incidents doivent être liés aux bonnes entreprises, classés selon les bonnes mesures de durabilité et se voir attribuer des scores de gravité précis.

Le même défi se pose pour l'extraction d'indicateurs à partir des informations fournies par les entreprises. Les rapports sont des documents tentaculaires remplis de notes de bas de page et de tableaux complexes, rarement exprimés en termes normalisés. Dans ce cas, des systèmes d'IA spécialisés (depuis la reconnaissance optique de caractères (OCR) et l'analyse de la mise en page jusqu'à des modèles affinés formés sur de vastes ensembles de données étiquetées) capturent et structurent les détails bruts, détectant des indicateurs clés de performance spécifiques au développement durable qui, autrement, seraient perdus. 

Dans un cas, une entreprise a fait référence à ses avantages sociaux en matière de garde d'enfants de manière indirecte, en décrivant des "jardins d'enfants pour le personnel", des "services de garde d'appoint" et des "bons de crèche". Le rapport n'ayant jamais utilisé l'expression précise "services de garde d'enfants", les annotateurs humains n'ont pas tenu compte de ces passages. Nos outils d'extraction ont toutefois reconnu l'équivalence sémantique et les ont correctement mis en correspondance avec la mesure sociale correspondante. Cette simple étape a permis de remodeler le profil de l'entreprise, révélant un programme de soutien aux employés plus solide que ce que l'on pensait auparavant. Un détail suffisamment petit pour être ignoré, mais suffisamment important pour influencer les décisions d'investissement.

C'est pourquoi chaque point de données doit être étiqueté avec sa provenance - sa source, son horodatage, sa méthode d'extraction et son indice de confiance - afin qu'il puisse être tracé et vérifié. Une fois ces éléments en place, la base de l'IA devient fiable. Ce n'est qu'à ce moment-là que la GenAI peut être véritablement transformatrice : elle fournit des informations qui sont non seulement précises et vérifiables, mais aussi plus rapides à générer et plus intelligentes sur le plan contextuel. Sans cette base, l'IA générique fonctionne dans l'obscurité.

L'engouement pour la GenAI nous détourne de la véritable innovation

La véritable révolution dans le domaine de la finance durable ne viendra pas de l'intégration de ChatGPT dans un tableau de bord. Elle viendra de la résolution du problème sale et ingrat de l'infrastructure de données, de la construction de pipelines capables de prendre des données brutes, non structurées, multilingues et souvent contradictoires, et de les transformer en résultats fiables, utilisables et exploitables.

Une fois cela en place, les systèmes d'IA peuvent générer les données vérifiées, et GenAI peut alors les amplifier, créant des rapports, des informations et des analyses à grande vitesse et à grande échelle, améliorant ainsi considérablement l'efficacité pour les investisseurs, les régulateurs et les entreprises. La voie à suivre est celle d'une IA judicieuse : pas seulement de grands modèles, mais des modèles intelligents, conçus spécialement pour la durabilité, équilibrant la précision, l'efficacité et la rentabilité.

Dans le domaine de la finance durable, la technologie tape-à-l'œil ne fera pas avancer les choses. Ce sont les données fiables qui le feront.

Marsal Gavaldà

Directeur de la technologie, Clarity AI

Marsal est un cadre supérieur dans le domaine de l'ingénierie qui possède une grande expertise dans les domaines de la parole, du langage et de l'apprentissage automatique. Il met en place des équipes d'ingénieurs centrées sur les données, stimule l'innovation en matière de produits et organise également un sommet annuel sur la science et la culture qui explore des sujets allant de la traduction automatique aux neurosciences.

Recherche et perspectives

Dernières nouvelles et articles

Aperçu du marché

Le nouvel ESG : énergie, souveraineté, géostratégie

Découvrez comment la souveraineté, la sécurité énergétique et les risques géopolitiques redéfinissent la résilience dans un monde où les chaînes d'approvisionnement sont fragiles.

Marchés privés

Les marchés privés en 2026 : tendances macroéconomiques et implications pour le flux des transactions

En 2026, les marchés privés connaissent une profonde mutation structurelle, passant d'un avantage en termes de capital à un avantage en termes d'information. 

AI

Série : IA et qualité des données

Session 2 : Utilisons-nous l'IA pour les bonnes tâches ? Les capacités de l'IA progressent rapidement, mais son adoption dans la pratique révèle une réalité bien différente. Des études montrent que, si l'IA pourrait théoriquement automatiser une grande partie des tâches dans de nombreux métiers, son utilisation quotidienne est en réalité bien plus limitée. Dans des domaines à haut risque comme la finance, les principaux obstacles…