Duurzaam beleggen: Hoe datawetenschap de betrouwbaarheid van gerapporteerde gegevens kan verbeteren

AI 3 februari 2022

Clarity AI standaardiseert ESG-gegevens om een betrouwbare database op te zetten voordat de CSRD-rapportage wordt ingevoerd

Gegevens over duurzaamheidsprestaties staan nog in de kinderschoenen. Door de richtlijn inzake maatschappelijke verslaglegging (CSRD) zullen deze gegevens uiteindelijk deel uitmaken van de jaarverslagen van bedrijven met controle door derden. De CSRD zal echter pas in 2025 volledig ten uitvoer zijn gelegd, en in de tussentijd valt een beperkte betrouwbaarheid van de gerapporteerde gegevens te verwachten. Deze beperkte betrouwbaarheid geldt zelfs voor algemeen gebruikte kwantitatieve meeteenheden zoals Scope 1 CO2-emissies, die - ondanks het feit dat het een zeer belangrijke meeteenheid is - kunnen lijden onder grote variabiliteit tussen de gegevensbronnen. Dit komt door fouten, gebrek aan standaardisatie en een algemeen slechte gegevenskwaliteit van de ene aanbieder tot de andere. Dit geldt zelfs voor gegevens die door de bedrijven zelf worden gerapporteerd. Hoe groter de variabiliteit, hoe minder betrouwbaar de gegevens.

Variabiliteit tussen de door de Clarity AI

 

Clarity AI maakt gebruik van drie belangrijke differentiators om de meest betrouwbare database te creëren die vandaag beschikbaar is:

  • Verzamel de grootste verzameling gestructureerde en ongestructureerde gegevensbronnen in een wereldwijde database.
  • Gebruik van interne en externe technische gegevensexpertise om deze database samen te voegen, op te schonen en te standaardiseren.
  • Gebruik maken van eigen machine-learning algoritmen en data science technieken om uitschieters te detecteren en automatisch de beste bron te selecteren voor overlappende gegevens, alsmede om nauwkeurige schattingen te verkrijgen voor niet-gerapporteerde gegevens.

Gegevensbronnen

Clarity AI put uit meer dan twee miljoen datapunten van verschillende typen (bijvoorbeeld kwantitatief, kwalitatief en nieuws). Het beschikt over eigen gegevens van machine-learningmodellen die metrieken schatten ter aanvulling van niet-openbare informatie van organisaties, en exclusieve gegevensbronnen van Clarity AI partnerschappen met wereldwijde, erkende gegevensleveranciers (bijvoorbeeld voor controversieel nieuws) maken het mogelijk diepere en rijkere inzichten te genereren.

Hoe Clarity AI de meest betrouwbare database bereikt

Technische gegevens

Clarity AIDe data engineering- en DevOps-teams zijn experts in het beheer van de levenscyclus van gegevens, en ze maken gebruik van geavanceerde technologie en tools voor automatische opname, verwerking, validatie en opslag van gegevens. Ons team kan deskundig de andere gegevens van een bedrijf opschonen en standaardiseren, deze classificeren in groepen van gelijken en belangrijke operationele statistieken identificeren.

Kunstmatige Intelligentie

Bevestigde gegevens zijn geweldig; drievoudig bevestigde gegevens zijn beter. Clarity AI gebruikt zijn meerdere bronnen en overlappende dekking van belangrijke statistieken om de consistentie en betrouwbaarheid van de gegevens te garanderen. Om mogelijke inconsistenties binnen deze geconsolideerde database te verwijderen, kiezen Clarity AI's eigen machine-learning algoritmen de beste bronnen en detecteren ze uitschieters, net zoals een analist zou doen op basis van domeinexpertise - maar dan op schaal en zonder menselijke vooringenomenheid.

Casus

Het cijfer voor de 2019 Scope 1 CO2-emissies van Salesforce werd in verschillende gegevensbronnen inconsistent gerapporteerd. Twee gegevensleveranciers boden een waarde van 5.800 ton. Een derde aanbieder zei 5.000 ton, en een vierde meldde 50.000 ton. Clarity AI's algoritme concludeerde dat de waarde van 5.000 ton het meest betrouwbaar was, en deze conclusie werd vervolgens ondersteund door Salesforce's eigen jaarverslag.

Bekijk het volledige verslag hier

Vul uw e-mailadres in om meer te lezen en voortdurend inzichten te ontvangen van Clarity AI.