Spotlight: Datenqualität - Dimension 4, Datenaktualisierungen

Datenqualität 1. Juni 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Eine Interviewreihe mit dem Clarity AI Executive Team über die 8 Dimensionen der Datenqualität

Wie wird sichergestellt, dass die Daten von Clarity AI von höchster Qualität sind?

Clarity AI verwendet einen achtdimensionalen Rahmen, um sicherzustellen, dass die Daten von höchster Qualität sind. Diese Dimensionen sind Erfassungsgrad, Frische / Aktualität, Genauigkeit, Datenaktualisierung, Erklärbarkeit, Konsistenz, Zeitpunkt und Feedback. In dieser Reihe von Interviews mit Führungskräften von Clarity AI wird jede dieser Dimensionen erforscht und erläutert. Clarity AIDas Expertenteam des Unternehmens entwickelt wissenschaftliche und evidenzbasierte Methoden, die dann leistungsstarke, skalierbare künstliche Intelligenz (z. B. maschinelles Lernen) nutzen, um bestehende Datensätze zu sammeln, zu bereinigen, zu analysieren und zu erweitern, um die Sustainability-Tech-Plattform zu betreiben oder direkt in die bestehenden Arbeitsabläufe der Nutzer zu integrieren.

Dimension 4 - Datenaktualisierungen

Clarity AIÁngel Agudo, VP of Product, Patricia Pina, Head of Product Research & Innovation, Juan Diego Martin, Head of Data Strategy, und Ron Potok, Head of Data Science, diskutieren mit Chris Ciompi, Chief Marketing Officer von Clarity AI, über die kritische Dimension von Datenaktualisierungen und deren Beziehung zur Datenqualität. 

Chris Ciompi: Herzlich willkommen, alle zusammen. Lassen Sie uns mit Ihnen beginnen, Ángel. Können Sie bitte die Datenaktualisierung in Bezug auf die Datenqualität definieren?

Ángel Agudo: Die Datenaktualisierungen sind die Prozesse, mit denen wir neue Informationen in das Tool einarbeiten. Dies ist ein entscheidender Aspekt der Datenqualität: Wir müssen sicherstellen, dass wir die richtige Häufigkeit haben, um den Kunden die frischesten Daten zur Verfügung zu stellen, damit sie auf die aktuellsten verfügbaren Informationen zugreifen können.

Chris Ciompi: Verstehe. Patricia, warum sind Datenaktualisierungen für Verbraucher von Nachhaltigkeitsdaten wichtig?

Patricia Pina: Die Infrastruktur und die Prozesse, die Datenaktualisierungen ermöglichen, sind für die Nutzer von Nachhaltigkeitsdaten von entscheidender Bedeutung. Unsere Kunden müssen in der Lage sein, jederzeit auf die genauesten und aktuellsten Informationen zuzugreifen, die für ihre Entscheidungen relevant sind. Clarity AI hat erhebliche Ressourcen investiert, um sicherzustellen, dass unsere Datenaktualisierungen je nach Kundenanforderung in unterschiedlichen Intervallen bereitgestellt werden können, ohne dass es zu einer Beeinträchtigung der Kundenerfahrung und der von uns angebotenen Dienstleistungen kommt. Unsere Kunden müssen beispielsweise sofort wissen, wenn eine neue Kontroverse über einen Korruptionsfall an die Presse durchgesickert ist, aber ein Unternehmen meldet seine Treibhausgasdaten nur auf jährlicher Basis. Dies erfordert die Fähigkeit, Datenaktualisierungen auf flexible und zeitnahe Weise zu modularisieren. Ein weiterer sehr wichtiger Aspekt unserer Datenaktualisierungen ist, dass wir nicht darauf warten müssen, dass alle Unternehmen einen aktualisierten Wert melden, um ihn in unserem Produkt zu berücksichtigen. Die Unternehmen werden zu unterschiedlichen Zeitpunkten berichten, Clarity AI wird diese Daten sammeln und sie unseren Kunden zur Verfügung stellen, sobald sie veröffentlicht werden. Wir sammeln und aktualisieren die Daten kontinuierlich, um sicherzustellen, dass unsere Kunden an jedem einzelnen Tag die besten verfügbaren Informationen nutzen können.

Chris Ciompi: Vielen Dank dafür. Okay, Juan Diego. Wie stellt Clarity AI sicher, dass seine Daten auf dem neuesten Stand sind?

Juan Diego Martín: Clarity AI hat einen sehr rationalisierten Prozess, um erstens zu erkennen, wenn Unternehmen bestimmte Informationen in ihren Berichten und öffentlichen Quellen aktualisieren. Zweitens werden diese Informationen so schnell wie möglich verarbeitet, und drittens gibt es eine zusätzliche Ebene der Datenqualität, die KI und Menschen kombiniert, um sicherzustellen, dass diese Informationen den Kunden auf die bestmögliche Weise zur Verfügung gestellt werden. Alles ist miteinander verbunden. Wenn das Unternehmen bestimmte Informationen aktualisiert, sind wir bereits auf der Suche nach diesen Informationen. Wir wissen in der Regel, wann eine Aktualisierung ansteht: Es gibt eine Warnung oder ein Signal, das es uns ermöglicht, diese Informationen so schnell wie möglich abzurufen und sie automatisch in die von uns verwendete Verarbeitungspipeline aufzunehmen. Die Daten durchlaufen dann KI-Modelle, die vom Data Science Team unter der Leitung von Ron erstellt werden. Dann werden sie in spezifische Qualitätsprüfungen einbezogen. Wenn es etwas gibt, das von einem Menschen überprüft werden muss, haben wir die richtige Person mit den richtigen Fähigkeiten, um diese Daten zu überprüfen. Nachdem alles erledigt ist, gibt es eine zusätzliche Ebene, die es uns ermöglicht, spezifische Informationen zu erstellen, die wir in das Produkt aufnehmen wollen. Das ist also das, was ich als rationalisierten Prozess bezeichnet habe: Erkennung, Aufnahme, Verarbeitung, menschliche Algorithmen, Verarbeitung und Übergabe an das Tool.

Chris Ciompi: Können Sie ein wenig mehr darüber sagen, wie unsere Datenaktualisierungen auf Clarity AI von künstlicher Intelligenz beeinflusst werden und wie KI die Datenaktualisierungen beeinflusst?

Ron Potok: Es gibt eigentlich zwei Komponenten. Die eine ist die Effizienz auf der Qualitätsseite, die sicherstellt, dass die Datenaktualisierungen, die wir vornehmen, von hoher Qualität und häufig sind. Der zweite Punkt ist unser automatisiertes Verfahren zur Kennzeichnung von Datenpunkten, die verdächtig aussehen, so dass sie nie in das Produkt gelangen. Das sind alles automatisierte Prozesse. Sie werden von hochentwickelten maschinellen Lernmodellen abgefangen, einschließlich unseres Zuverlässigkeitsmodells, über das wir bereits in einem früheren Gespräch gesprochen haben. Das ist alles voll automatisiert. Ungefähr in Echtzeit können wir erkennen, ob ein Datenpunkt verdächtig ist oder nicht, und ihn für eine weitere manuelle Überprüfung kennzeichnen. Ein weiteres Unterscheidungsmerkmal in Bezug auf Datenaktualisierungen ist, dass wir ein Technologieunternehmen sind. Wir haben uns KI zunutze gemacht, um einen sehr viel effizienteren Prozess der Nachrichtenberichterstattung zu ermöglichen als viele unserer Konkurrenten. Dadurch können wir unser Nachrichtenmodul sehr häufig aktualisieren, um ESG-Kontroversen sehr schnell zu erkennen und die Aktualisierungshäufigkeit von Kontroversen zu erhöhen, was im Vergleich zu den meisten unserer Konkurrenten im ESG-Bereich sehr unterschiedlich ist. Diese Fähigkeit, Nachrichteninformationen häufig zu aktualisieren, basiert auf unserem einzigartigen Kontroversen-Prozess mit menschlichen und KI-Schleifen und einem großen Sprachmodell.

Chris Ciompi: Okay, lassen Sie uns ein wenig konkreter über Kontroversen und NLP sprechen. Wie funktioniert das?

Ron Potok: Jeden Tag nehmen wir über 1,4 Millionen Artikel aus mehr als 30.000 vertrauenswürdigen Nachrichtenquellen auf, die automatisch von unserer KI-basierten Nachrichtenmaschine verarbeitet werden. Unsere KI-Engine ordnet ESG-Kontroversen effizient zu, erkennt sie und ordnet ihnen einen Schweregrad zu. Unsere Analysten überprüfen dann die Ergebnisse und setzen sie in die Produktion um. Der Einsatz von KI macht den Prozess viel effizienter und ermöglicht es uns, die Nadeln im Heuhaufen der Artikel zu finden.

Chris Ciompi: Ich möchte nur einen Punkt klarstellen. Die KI erhöht also die Effizienz beim Auffinden von Dingen, die dann noch von einem (menschlichen) Experten in unserem Team überprüft werden müssen.

Ron Potok: Richtig.

Chris Ciompi: Vielen Dank dafür. Ok, Patricia, wie tragen Datenaktualisierungen zur Produktinnovation bei Clarity AI bei?

Patricia Pina: Als digitales Unternehmen sind wir bestrebt, Transparenz auf eine Art und Weise umzusetzen, die in unser digitales Produkt eingebettet ist und auf die unsere Kunden direkt zugreifen und sich selbst bedienen können. Dasselbe Prinzip wenden wir auf unsere Datenaktualisierungen an. Jeder Kunde kann jederzeit durch unser Datenaktualisierungsprotokoll navigieren und nachvollziehen, welche Änderungen an welchem Datum vorgenommen wurden und welche impact sie haben. Wenn unsere Kunden eine unserer Bewertungen oder Datenpunkte anfechten möchten, können sie dies direkt über unser Tool tun, das automatisch einen Überprüfungsprozess einleitet und, wenn es als angemessen erachtet wird, eine Datenaktualisierung auslöst. Vollständig vernetzte End-to-End-Prozesse, einschließlich Datenaktualisierungen, die durch Technologie ermöglicht werden, sind Teil unserer Philosophie.

Ángel Agudo: Lassen Sie mich hier nur noch eines hinzufügen. Die Software-Plattform besteht aus zwei Teilen. Das eine ist die Technologie, mit der wir alle Daten verarbeiten können. Sobald die Informationen vorliegen, sorgen wir für Transparenz, indem wir eine Top-Down- und Bottom-Up-Ansicht kombinieren und die Fähigkeit zeigen, den Kunden zu helfen, die neuen Daten zu verstehen und zu nutzen. Transparenz bedeutet, dass wir die Kunden jedes Mal informieren, wenn die Daten aktualisiert werden. Wir bieten auch eine Top-Down-Ansicht aller Teile, die über alle Produkte hinweg einheitlich aktualisiert wurden, sowie eine Bottom-Up-Ansicht, die es ihnen ermöglicht, zu verstehen, was in den einzelnen Datenpunkten geschehen ist. Außerdem bieten wir Warnmeldungen und Berichte an, die ihnen helfen, den Überblick über die Daten zu behalten. Schließlich bieten wir etwas an, das es den Kunden ermöglicht, die Gründe für die Datenaktualisierung zu verstehen. Dafür kann es verschiedene Gründe geben. Vielleicht liegt es daran, dass ein Unternehmen einen neuen Nachhaltigkeitsbericht veröffentlicht hat, der eine Aktualisierung der Informationen für ein bestimmtes Jahr veranlasst. Es könnte auch sein, dass das Unternehmen einen Datenpunkt aus einem früheren Bericht korrigiert hat. Was auch immer der Grund ist, es gibt eine Funktion, die mit dem Datenprotokoll verbunden ist. Dadurch wird nicht nur signalisiert, dass die Daten aktualisiert wurden, sondern auch, warum ein Datenpunkt aktualisiert wurde.

Chris Ciompi: Okay. Lassen Sie mich ein wenig auf den Aspekt eingehen, den Sie gerade in Bezug auf die Kunden vorgebracht haben, richtig? Glauben Sie, dass die Kunden, die dies nutzen, den gleichen Wert in diesen drei Dimensionen sehen, über die Sie gerade gesprochen haben?

Ángel Agudo: Die Kunden finden die Top-Down-Ansicht hilfreich, weil sie die Aktualisierungen zusammenfasst und die Informationen leichter verdaulich macht. Gleichzeitig brauchen sie die Möglichkeit, einzelne Datenpunkte aufzurufen, wenn sie eine detailliertere Analyse durchführen wollen. Die Priorisierung der Top-Down-Ansicht ist sehr wichtig, weil sie einen Eindruck davon vermittelt, was aktualisiert wurde. Die granulare Erklärbarkeit ist hilfreich, wenn die Kunden eine tiefer gehende Analyse durchführen wollen.

Chris Ciompi: Verstanden. Okay, alles klar. Vielen Dank an alle.

Geben Sie Ihre E-Mail-Adresse ein, um mehr zu erfahren

Demo anfordern