Investissements durables : Comment la science des données peut améliorer la fiabilité des données communiquées

AI
Publié : 3 février 2022
Mise à jour : 9 septembre 2024
Investissements durables : Comment la science des données peut améliorer la fiabilité des données communiquées

Clarity AI standardise les données ESG afin d'établir une base de données fiable avant la mise en œuvre du reporting CSRD

Les données sur les performances en matière de durabilité n'en sont encore qu'à leurs débuts. La directive sur les rapports de durabilité des entreprises (CSRD) permettra à terme d'intégrer ces données dans les rapports annuels des entreprises, avec un audit par un tiers. Toutefois, la CSRD ne sera pas pleinement mise en œuvre avant 2025 et, dans l'intervalle, il faut s'attendre à une fiabilité limitée des données communiquées. Cette fiabilité limitée s'applique même aux mesures quantitatives largement utilisées telles que les émissions de CO2 du champ d'application 1, qui, bien qu'étant une mesure très importante, peuvent souffrir d'une grande variabilité entre les sources de données. Cela est dû aux erreurs, au manque de normalisation et à la mauvaise qualité générale des données d'un fournisseur à l'autre. Cela est vrai même lorsqu'il s'agit de données communiquées par les entreprises elles-mêmes. Plus la variabilité est élevée, moins les données sont fiables.

Variabilité entre les fournisseurs de données utilisés par les Clarity AI

 

Clarity AI s'appuie sur trois différentiateurs clés pour établir la base de données la plus fiable disponible aujourd'hui :

  • Rassembler la plus grande collection de sources de données structurées et non structurées dans une base de données mondiale.
  • Utiliser l'expertise interne et externe en matière de données techniques pour agréger, nettoyer et normaliser cette base de données.
  • Exploitez des algorithmes exclusifs d'apprentissage automatique et des techniques de science des données pour détecter les valeurs aberrantes et sélectionner automatiquement la meilleure source pour les données qui se chevauchent, ainsi que pour obtenir des estimations précises pour les données non déclarées.

Sources des données

Clarity AI s'appuie sur plus de deux millions de points de données de différents types (par exemple, quantitatifs, qualitatifs et d'actualité). Il dispose de données exclusives provenant de modèles d'apprentissage automatique qui estiment les paramètres pour compléter les informations non divulguées des organisations, et de sources de données exclusives provenant de Clarity AI partenariats avec des fournisseurs de données reconnus dans le monde entier (par exemple, pour les nouvelles controversées) qui permettent de générer des informations plus riches et plus approfondies.

Comment Clarity AI obtient la base de données la plus fiable

Expertise en matière de données techniques

Clarity AILes équipes d'ingénierie des données et de DevOps sont des experts de la gestion du cycle de vie des données et s'appuient sur des technologies et des outils de pointe pour l'ingestion, le traitement, la validation et le stockage automatisés des données. Notre équipe peut nettoyer et normaliser de manière experte les autres données d'une entreprise, en les classant dans des groupes de pairs et en identifiant des mesures opérationnelles clés.

Intelligence artificielle

Des données confirmées, c'est bien ; des données triplement confirmées, c'est encore mieux. Clarity AI utilise ses multiples sources, ainsi que le chevauchement de la couverture des mesures clés, pour garantir la cohérence et la fiabilité des données. Pour éliminer les incohérences potentielles au sein de cette base de données consolidée, les algorithmes d'apprentissage automatique exclusifs de Clarity AIchoisissent les meilleures sources et détectent les valeurs aberrantes, comme le ferait un analyste sur la base de son expertise du domaine, mais à grande échelle et sans parti pris humain.

Étude de cas

Le nombre d'émissions de CO2 Scope 1 de Salesforce pour 2019 a été indiqué de manière incohérente dans diverses sources de données. Deux fournisseurs de données ont proposé une valeur de 5 800 tonnes. Un troisième fournisseur a indiqué 5 000 tonnes, et un quatrième a indiqué 50 000 tonnes. Clarity AIL'algorithme de Salesforce a conclu que la valeur de 5 000 tonnes était la plus fiable, et cette conclusion a été confirmée par le rapport annuel de Salesforce.

Accédez au rapport complet ici

Saisissez votre adresse e-mail pour en savoir plus

Demander une démo