Investissements durables : Comment la science des données peut améliorer la fiabilité des données communiquées

AI 3 février 2022

Clarity AI standardise les données ESG afin d'établir une base de données fiable avant la mise en œuvre du reporting CSRD.

Les données sur les performances en matière de durabilité n'en sont encore qu'à leurs débuts. La directive sur les rapports de durabilité des entreprises (CSRD) permettra à terme d'intégrer ces données dans les rapports annuels des entreprises, avec un audit par un tiers. Toutefois, la CSRD ne sera pas pleinement mise en œuvre avant 2025 et, dans l'intervalle, il faut s'attendre à une fiabilité limitée des données communiquées. Cette fiabilité limitée s'applique même aux mesures quantitatives largement utilisées telles que les émissions de CO2 du champ d'application 1, qui, bien qu'étant une mesure très importante, peuvent souffrir d'une grande variabilité entre les sources de données. Cela est dû aux erreurs, au manque de normalisation et à la mauvaise qualité générale des données d'un fournisseur à l'autre. Cela est vrai même lorsqu'il s'agit de données communiquées par les entreprises elles-mêmes. Plus la variabilité est élevée, moins les données sont fiables.

Variabilité des fournisseurs de données utilisés par Clarity AI

 

Clarity AI s'appuie sur trois différentiateurs clés pour établir la base de données la plus fiable disponible aujourd'hui :

  • Rassembler la plus grande collection de sources de données structurées et non structurées dans une base de données mondiale.
  • Utiliser l'expertise interne et externe en matière de données techniques pour agréger, nettoyer et normaliser cette base de données.
  • Exploitez des algorithmes exclusifs d'apprentissage automatique et des techniques de science des données pour détecter les valeurs aberrantes et sélectionner automatiquement la meilleure source pour les données qui se chevauchent, ainsi que pour obtenir des estimations précises pour les données non déclarées.

Sources des données

Clarity AI s'appuie sur plus de deux millions de points de données de différents types (par exemple, quantitatifs, qualitatifs et d'actualité). Elle dispose de données exclusives issues de modèles d'apprentissage automatique qui estiment des paramètres pour compléter les informations non divulguées des organisations, et des sources de données exclusives issues des partenariats de Clarity AI avec des fournisseurs de données reconnus dans le monde entier (par exemple, pour les actualités controversées) permettent de générer des informations plus profondes et plus riches.

Comment Clarity AI obtient la base de données la plus fiable ?

Expertise en matière de données techniques

Les équipes DevOps et d'ingénierie des données de Clarity AI sont expertes dans la gestion du cycle de vie des données, et elles s'appuient sur des technologies et des outils de pointe pour l'ingestion, le traitement, la validation et le stockage automatisés des données. Notre équipe peut nettoyer et normaliser de manière experte les autres données d'une entreprise, en les classant dans des groupes de pairs et en identifiant les principales mesures opérationnelles.

Intelligence artificielle

Des données confirmées, c'est bien ; des données triplement confirmées, c'est mieux. Clarity AI utilise ses multiples sources, ainsi que le chevauchement de la couverture des mesures clés, pour garantir la cohérence et la fiabilité des données. Pour éliminer les incohérences potentielles dans cette base de données consolidée, les algorithmes d'apprentissage automatique exclusifs de Clarity AI choisissent les meilleures sources et détectent les valeurs aberrantes, tout comme le ferait un analyste en se basant sur son expertise du domaine, mais à grande échelle et sans biais humain.

Étude de cas

Le nombre d'émissions de CO2 de portée 1 de Salesforce pour 2019 a été signalé de manière incohérente dans diverses sources de données. Deux fournisseurs de données ont proposé une valeur de 5 800 tonnes. Un troisième fournisseur a indiqué 5 000 tonnes, et un quatrième a fait état de 50 000 tonnes. L'algorithme de Clarity AI a conclu que la valeur de 5 000 tonnes était la plus fiable, et cette conclusion a ensuite été confirmée par le propre rapport annuel de Salesforce.

Accédez au rapport complet ici

Entrez votre adresse e-mail pour en savoir plus et recevoir des informations continues de Clarity AI.