Nachhaltiges Investieren: Wie die Datenwissenschaft die Zuverlässigkeit der gemeldeten Daten verbessern kann
Inhaltsübersicht
Clarity AI standardisiert die ESG-Daten, um vor der Einführung der CSRD-Berichterstattung eine zuverlässige Datenbasis zu schaffen
Die Daten zur Nachhaltigkeitsleistung stecken noch in den Kinderschuhen. Die Richtlinie über die Nachhaltigkeitsberichterstattung von Unternehmen (CSRD ) wird diese Daten schließlich zu einem Bestandteil der Jahresberichte von Unternehmen machen, die von Dritten geprüft werden. Die CSRD wird jedoch nicht vor 2025 vollständig umgesetzt werden, und in der Zwischenzeit ist mit einer begrenzten Zuverlässigkeit der gemeldeten Daten zu rechnen. Diese begrenzte Verlässlichkeit gilt sogar für weit verbreitete quantitative Messgrößen wie die CO2-Emissionen nach Scope 1, die - obwohl es sich um eine sehr wesentliche Messgröße handelt - unter einer hohen Variabilität zwischen den Datenquellen leiden können. Dies liegt an Fehlern, mangelnder Standardisierung und einer insgesamt schlechten Datenqualität von Anbieter zu Anbieter. Dies gilt selbst dann, wenn es sich um Daten handelt, die von den Unternehmen selbst gemeldet werden. Je höher die Variabilität, desto weniger zuverlässig sind die Daten.
Clarity AI nutzt drei wichtige Unterscheidungsmerkmale, um die zuverlässigste heute verfügbare Datenbank zu schaffen:
- Stellen Sie die größte Sammlung strukturierter und unstrukturierter Datenquellen in einer globalen Datenbank zusammen.
- Nutzen Sie internes und externes Fachwissen über technische Daten, um diese Datenbank zu aggregieren, zu bereinigen und zu standardisieren.
- Nutzen Sie firmeneigene Algorithmen des maschinellen Lernens und Data-Science-Techniken, um Ausreißer zu erkennen und automatisch die beste Quelle für sich überschneidende Daten auszuwählen, sowie um genaue Schätzungen für nicht gemeldete Daten zu erhalten.
Datenquellen
Clarity AI stützt sich auf mehr als zwei Millionen Datenpunkte verschiedener Art (z. B. quantitative, qualitative und Nachrichten). Es verfügt über proprietäre Daten aus Machine-Learning-Modellen, die Metriken schätzen, um die nicht offengelegten Informationen von Organisationen zu ergänzen, und exklusive Datenquellen aus Clarity AI Partnerschaften mit weltweit anerkannten Datenanbietern (z. B. für kontroverse Nachrichten) ermöglichen eine tiefere und reichhaltigere Erkenntnisgewinnung.
Fachwissen über technische Daten
Clarity AIUnsere Data-Engineering- und DevOps-Teams sind Experten für das Lebenszyklusmanagement von Daten und nutzen modernste Technologien und Tools für die automatisierte Aufnahme, Verarbeitung, Validierung und Speicherung von Daten. Unser Team ist in der Lage, die sonstigen Daten eines Unternehmens fachmännisch zu bereinigen und zu standardisieren, sie in Vergleichsgruppen zu klassifizieren und wichtige Betriebskennzahlen zu ermitteln.
Künstliche Intelligenz
Bestätigte Daten sind gut, dreifach bestätigte Daten sind besser. Clarity AI nutzt seine zahlreichen Quellen sowie die überlappende Abdeckung der wichtigsten Kennzahlen, um die Konsistenz und Zuverlässigkeit der Daten zu gewährleisten. Um potenzielle Unstimmigkeiten innerhalb dieser konsolidierten Datenbank zu beseitigen, wählen die firmeneigenen Algorithmen des maschinellen Lernens von Clarity AIdie besten Quellen aus und erkennen Ausreißer, so wie es ein Analyst auf der Grundlage seines Fachwissens tun würde - allerdings in großem Maßstab und ohne menschliche Voreingenommenheit.
Fallstudie
Die Zahl für die Scope-1-CO2-Emissionen von Salesforce im Jahr 2019 wurde in verschiedenen Datenquellen uneinheitlich angegeben. Zwei Datenanbieter gaben einen Wert von 5.800 Tonnen an. Ein dritter Anbieter gab 5.000 Tonnen an, und ein vierter meldete 50.000 Tonnen. Clarity AIDer Algorithmus von Salesforce kam zu dem Schluss, dass der Wert von 5.000 Tonnen am zuverlässigsten war, und diese Schlussfolgerung wurde dann durch den Jahresbericht von Salesforce selbst bestätigt.