Spotlight: Datenqualität - Dimension 1, Erfassungsbereich

Datenqualität 27. April 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Eine Interviewreihe mit dem Clarity AI Executive Team über die 8 Dimensionen der Datenqualität

Wie wird sichergestellt, dass die Daten von Clarity AI von höchster Qualität sind?

Clarity AI verwendet einen achtdimensionalen Rahmen, um sicherzustellen, dass die Daten von höchster Qualität sind. Diese Dimensionen sind Erfassungsgrad, Genauigkeit, Frische / Aktualität, Datenaktualisierung, Erklärbarkeit, Konsistenz, Zeitpunkt und Feedback. In dieser Reihe von Interviews mit Führungskräften von Clarity AI wird jede dieser Dimensionen erforscht und erläutert. Clarity AIDas Expertenteam des Unternehmens entwickelt wissenschaftliche und evidenzbasierte Methoden, die dann leistungsstarke, skalierbare künstliche Intelligenz (z. B. maschinelles Lernen) nutzen, um bestehende Datensätze zu sammeln, zu bereinigen, zu analysieren und zu erweitern, um die Sustainability-Tech-Plattform zu betreiben oder direkt in die bestehenden Arbeitsabläufe der Nutzer zu integrieren.

Dimension 1 - Erfassungsbereich

Clarity AIÁngel Agudo, VP of Product, Patricia Pina, Head of Product Research & Innovation, Juan Diego Martín, Head of Data Strategy, und Ron Potok, Head of Data Science, diskutieren mit Chris Ciompi, Chief Marketing Officer von Clarity AI, über die kritische Dimension der Reichweite und ihre Beziehung zur Datenqualität sowie über die Bedeutung der richtigen KI-Fähigkeiten für die Verwaltung großer und komplexer Datensätze. Eine wichtige Erkenntnis aus dem Gespräch war die Notwendigkeit von Methoden und Werkzeugen, um von Daten zu Informationen zu gelangen und so Erkenntnisse aus großen Datenmengen zu gewinnen.

Ein weiterer wichtiger Punkt, der von den Podiumsteilnehmern hervorgehoben wurde, war die Auswirkung von KI auf die Verbesserung der Datenqualität in Bezug auf die Datenabdeckung, wobei die Notwendigkeit von KI-Fähigkeiten zur effektiven Navigation und Verwaltung großer Informationsmengen betont wurde.

Chris Ciompi: Lassen Sie uns speziell über die Abdeckung sprechen. Ángel, können Sie bitte den Erfassungsgrad in Bezug auf die Datenqualität definieren?

Ángel Agudo: Was die Abdeckung angeht, müssen wir sicherstellen, dass wir die richtige Kombination von Metriken anbieten, die für unsere Kunden relevant sind.

Chris Ciompi: Warum ist die Berichterstattung für die Verbraucher von Nachhaltigkeitsdaten wichtig?

Patricia Pina: Eine breite Abdeckung ist wichtig, um sicherzustellen, dass verschiedene Nutzer (mit unterschiedlichen Bedürfnissen) Zugang zu den Daten der Unternehmen haben, die für sie relevant sind. Außerdem ist das Universum der relevanten Unternehmen dynamisch und kann sich ändern, so dass die Abdeckung dazu beiträgt, potenzielle Lücken zu identifizieren und sicherzustellen, dass die Kunden nichts Wichtiges verpassen.

Chris Ciompi: Juan Diego, wie breit ist die Abdeckung, die Clarity AI bieten kann?

Juan Diego Martín: Clarity AI bietet derzeit eine Abdeckung, die sich auf verschiedene Module erstreckt. Wir haben Module, die 40.000 bis 70.000 Unternehmen umfassen. Wir haben auch die Möglichkeit, Portfolios zu aggregieren, wobei wir 80.000 Primärfonds und über 360.000 Aktienklassen abdecken. Diese Kombination ist für unsere Kunden sehr hilfreich, um ihre Portfolios aus verschiedenen Blickwinkeln zu bewerten.

Chris Ciompi: Können Sie ein wenig mehr darüber sagen, warum das so wirkungsvoll ist?

Juan Diego Martín: Die Kunden haben Probleme mit Daten, die entweder die Informationen über die Fonds oder die Informationen über die Unternehmen nur teilweise abdecken. Clarity AI ist in der Lage, diese Informationen zu kombinieren und zu aggregieren, wobei die letztendliche Zusammensetzung eines Portfolios betrachtet wird, und Informationen auf Unternehmensebene, auf Fondsebene, auf Portfolioebene oder sogar auf Unternehmensebene durch die Aggregation aller Portfolios innerhalb eines bestimmten Fondsmanagers bereitzustellen.

Chris Ciompi: Ron, wie wird der Umfang der Berichterstattung über Clarity AI durch künstliche Intelligenz beeinflusst?

Ron Potok: Wenn wir von Erfassung sprechen, denken wir zuerst an die gemeldeten Daten. Unternehmen veröffentlichen Nachhaltigkeitsberichte, und diese Berichte sind in der Regel PDF-Dokumente mit unstrukturierten Daten, einschließlich Text, Bildern und Tabellen. Wir können KI nutzen, um Informationen schnell und normalisiert aus diesen Dokumenten zu extrahieren. Die zweite Möglichkeit, wie wir die Abdeckung mit maschinellem Lernen und KI beeinflussen können, ist die Modellierung bestimmter Kennzahlen, die nicht alle Unternehmen berichten. Wir können die Erfassung bestimmter Kennzahlen erheblich verbessern, indem wir Modelle für maschinelles Lernen erstellen, die die Aktivitäten eines Unternehmens mit seinen Emissionen in Beziehung setzen. So können wir zum Beispiel CO2-Schätzungen für einen großen Teil der Unternehmen liefern, die ihre CO2-Emissionen nicht melden.

Chris Ciompi: Können Sie beim maschinellen Lernen ein wenig mehr darüber sagen, wie das genau abläuft und ob es sich im Laufe der Zeit verbessert?

Ron Potok: Als wir 2018 anfingen, meldeten etwa 5.000 Unternehmen ihre Emissionen, aber jetzt sind es 8.000 Unternehmen. Je mehr Unternehmen berichten, desto mehr können wir über diese Unternehmen erfahren und die Genauigkeit unseres Modells verbessern. Zweitens verbessern wir die Modelle ständig, indem wir ihnen weitere interessante Funktionen geben. Zum Beispiel arbeiten wir jetzt mit Satellitenbildern, um unsere Schätzmodelle zu verbessern, was unseren Erfassungsbereich erweitert. Wenn wir wissen, welche Kraftwerke und Zementfabriken Emissionen produzieren, können wir detailliertere und aktuellere Daten in die Modelle einfließen lassen und so genauere Vorhersagen treffen.

Chris Ciompi: Danke, Ron. Patricia, wie trägt die Berichterstattung zur Produktinnovation bei Clarity AI bei?

Patricia Pina: Wir bemühen uns um Effizienz, Skalierbarkeit und die Nutzung von Technologie für Innovationen auf Produktebene. Bei den gemeldeten Daten bieten wir eine vollständige Rückverfolgbarkeit der Datenpunkte zu ihrer Quelle und Links zu Berichten. Wir nutzen auch Schätzmodelle und Techniken des maschinellen Lernens, um die Lücken zu füllen, und wir stellen Konfidenzintervalle für jedes Modell sowie alle zusätzlichen Details über die Art des Modells und der Schätzung, die wir anbieten, zur Verfügung. So können unsere Kunden nachvollziehen, ob die Schätzung für ihren Anwendungsfall geeignet ist. Je nach den sich ändernden Marktbedürfnissen führen wir auch Innovationen bei der Datenerhebung und den damit verbundenen Dienstleistungen für die Erfassung durch.

Chris Ciompi: Können Sie mir ein konkretes Beispiel nennen?

Patricia Pina: Sicher. Wir haben zum Beispiel ein durchgängiges nachhaltiges Anlageprodukt mit breiter Abdeckung entwickelt, weil wir die notwendigen Bausteine zur Verfügung hatten. Wir haben den ersten Baustein in unserer EU-Taxonomie oder SDGs-Lösung, die den Beitrag eines Kunden zu ökologischen und sozialen Zielen misst und quantifiziert. Wir haben auch eine Lösung, die Werte für die Indikatoren für die wichtigsten negativen impact liefert, die für die Berichterstattung unterSFDR erforderlich sind. Und wir haben ein Kontroversen-Modul oder ein Exposure-Modul, das den Kunden ein gutes Gefühl für die Governance-Praktiken vermittelt.

Chris Ciompi: Vielen Dank, Patricia. Ángel, können Sie erläutern, wie sich der Umfang der Berichterstattung auf Clarity AI auf die Möglichkeiten der technischen Plattform auswirkt?

Ángel Agudo: Meiner Meinung nach ist es hier entscheidend, von Daten zu verwertbaren Informationen zu gelangen. Vor allem, wenn man große Datenmengen über verschiedene Organisationen, Messgrößen und Branchen hinweg verwaltet. Hier kommen Methoden und technologiebasierte Tools ins Spiel. Dies umfasst zwei Teile. Erstens brauchen wir Methoden, die uns dabei helfen, Erkenntnisse aus den Daten zu gewinnen, und zweitens Tools, die uns bei der Navigation und Sichtung dieser Informationen helfen können. Die Tools müssen in der Lage sein, die Informationen in Highlights und Details aufzuschlüsseln, oder umgekehrt, je nach den Bedürfnissen des Nutzers.

Geben Sie Ihre E-Mail-Adresse ein, um mehr zu erfahren