Pleins feux sur la qualité des données : Qualité des données - Dimension 4, mise à jour des données

Qualité des données 1er juin 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Une série d'entretiens avec l'équipe de direction de Clarity AI sur les 8 dimensions de la qualité des données

Comment Clarity AI s'assure-t-il que ses données sont de la plus haute qualité ?

Clarity AI utilise un cadre en huit dimensions pour garantir la qualité optimale des données. Ces dimensions sont la couverture, la fraîcheur / l'actualité, l' exactitude, la mise à jour des données, l'explicabilité, la cohérence, le point dans le temps et le retour d'information. Dans cette série d'entretiens avec des dirigeants de Clarity AI , chacune de ces dimensions est explorée et expliquée. Clarity AIL'équipe d'experts de l'entreprise crée des méthodologies scientifiques et factuelles qui s'appuient ensuite sur une intelligence artificielle puissante et évolutive (par exemple, l'apprentissage automatique) pour collecter, nettoyer, analyser et étendre les ensembles de données existants afin d'alimenter sa plateforme technologique de durabilité ou de l'intégrer directement dans les flux de travail existants des utilisateurs.

Dimension 4 - Mise à jour des données

Clarity AIÁngel Agudo, vice-président chargé des produits, Patricia Pina, responsable de la recherche et de l'innovation en matière de produits, Juan Diego Martin, responsable de la stratégie des données, et Ron Potok, responsable de la science des données, discutent, avec Chris Ciompi, directeur général du marketing de Clarity AI, de la dimension critique de la mise à jour des données et de sa relation avec la qualité des données. 

Chris Ciompi : Bienvenue à tous. Commençons par vous, Ángel. Pouvez-vous définir ce qu'est la mise à jour des données, en relation avec la qualité des données ?

Ángel Agudo : Les mises à jour des données sont les processus que nous utilisons pour incorporer de nouvelles informations dans l'outil. Il s'agit d'un aspect essentiel de la qualité des données : s'assurer que nous avons la bonne fréquence pour fournir les données les plus fraîches aux clients, afin qu'ils puissent accéder aux informations les plus récentes disponibles.

Chris Ciompi : Je comprends. Patricia, pourquoi les mises à jour de données sont-elles importantes pour les consommateurs de données sur le développement durable ?

Patricia Pina : L'infrastructure et les processus qui permettent la mise à jour des données sont essentiels pour les consommateurs de données sur le développement durable. Nos clients doivent être en mesure d'accéder aux informations les plus précises et les plus récentes pour prendre leurs décisions à tout moment. Clarity AI a investi des ressources importantes pour s'assurer que nos mises à jour de données peuvent être déployées à différentes fréquences en fonction de la demande des clients sans perturber leur expérience et le service que nous leur fournissons. Par exemple, nos clients ont besoin de savoir immédiatement s'il y a une nouvelle controverse sur une affaire de corruption qui a fait l'objet d'une fuite dans la presse, mais une entreprise ne communiquera ses données sur les GES que sur une base annuelle. Il faut donc pouvoir moduler les mises à jour de données de manière flexible et opportune. Un autre aspect très important de nos mises à jour de données est que nous n'avons pas besoin d'attendre que toutes les entreprises déclarent une valeur mise à jour pour la refléter dans notre produit. Les entreprises communiqueront leurs données à des moments différents, Clarity AI recueillera ces données et les mettra à la disposition de nos clients au fur et à mesure qu'elles seront publiées. Nous collectons et mettons à jour les données en permanence afin que nos clients puissent utiliser les meilleures informations disponibles chaque jour.

Chris Ciompi : Merci pour cela. D'accord, Juan Diego. Comment Clarity AI s'assure-t-il que ses données sont à jour ?

Juan Diego Martín : Clarity AI dispose d'un processus très rationalisé pour, premièrement, détecter lorsque les entreprises mettent à jour des informations spécifiques dans leurs rapports et sources publiques. Deuxièmement, traiter ces informations aussi rapidement que possible et, troisièmement, disposer d'une couche supplémentaire de qualité des données combinant l'IA et les humains, pour s'assurer que ces informations sont fournies aux clients de la meilleure façon possible. Tout est connecté. Lorsque l'entreprise met à jour certaines informations, nous sommes déjà à la recherche de ces informations. Nous savons généralement quand elle va être mise à jour : il y a une alerte ou un signal qui nous permet de récupérer cette information dès que possible et de l'ingérer automatiquement dans le pipeline de traitement que nous utilisons. Ces informations sont ensuite analysées par des modèles d'intelligence artificielle élaborés par l'équipe de science des données, dirigée par Ron. Elles sont ensuite soumises à des contrôles de qualité spécifiques. Si quelque chose doit être revu par un humain, nous avons la bonne personne avec les bonnes compétences pour examiner ces données. Une fois que tout est fait, il y a une couche supplémentaire qui nous permet de construire des informations spécifiques que nous voulons inclure dans le produit. C'est ce que j'ai appelé un processus rationalisé : détection, ingestion, traitement, algorithmes humains, traitement et livraison à l'outil.

Chris Ciompi : Pouvez-vous nous en dire un peu plus sur la façon dont nos mises à jour de données sur Clarity AI sont influencées par l'intelligence artificielle et sur la façon dont l'IA influence les mises à jour de données ?

Ron Potok : Il y a en fait deux composantes. Le premier est l'efficacité du point de vue de la qualité, en veillant à ce que les mises à jour de données que nous effectuons soient fréquentes et de grande qualité. Le second est notre processus automatisé de signalisation des points de données qui semblent suspects, afin qu'ils n'arrivent jamais dans le produit. Il s'agit là de processus automatisés. Ils sont détectés par des modèles sophistiqués d'apprentissage automatique, y compris notre modèle de fiabilité dont nous avons parlé dans une conversation précédente. Tout cela est entièrement automatisé. En temps quasi réel, nous pouvons voir si un point de données est suspect ou non et le signaler pour un examen manuel plus approfondi. Un autre facteur de différenciation en termes de mise à jour des données est le fait que nous sommes une entreprise technologique. Nous avons exploité l'IA pour mettre en place un processus de couverture de l'actualité beaucoup plus efficace que celui de bon nombre de nos concurrents. Cela nous permet de mettre à jour très fréquemment notre module d'actualités afin d'identifier très rapidement les controverses ESG et d'augmenter la fréquence de mise à jour des controverses, ce qui est très différent par rapport à la majorité de nos concurrents dans le domaine ESG. Cette capacité à mettre à jour fréquemment les informations d'actualité est entièrement basée sur notre processus unique de controverse par modèle de langage à large boucle humaine et IA.

Chris Ciompi : D'accord, parlons un peu plus précisément des controverses et de la PNL. Comment cela fonctionne-t-il ?

Ron Potok : Chaque jour, nous ingérons plus de 1,4 million d'articles provenant de plus de 30 000 sources d'information fiables, qui sont automatiquement traités par notre moteur d'information basé sur l'IA. Notre moteur d'IA attribue, détecte et attribue efficacement la gravité des controverses ESG. Nos analystes vérifient ensuite les résultats et les mettent en production. L'utilisation de l'IA rend le processus beaucoup plus efficace et nous permet de trouver les aiguilles dans la botte de foin des articles.

Chris Ciompi : Je voudrais juste clarifier un point. L'IA augmente donc l'efficacité de la recherche d'éléments qui doivent encore être examinés par un expert (humain) de notre équipe.

Ron Potok : C'est exact.

Chris Ciompi : Merci beaucoup. Ok, Patricia, comment les mises à jour des données aident-elles à stimuler l'innovation des produits sur Clarity AI?

Patricia Pina : En tant qu'entreprise numérique, nous nous engageons à mettre en œuvre la transparence de manière à ce qu'elle soit intégrée dans notre produit numérique et qu'elle puisse être consultée et utilisée en libre-service directement par nos clients. Nous appliquons le même principe à la mise à jour de nos données. Tout client peut, à tout moment, naviguer dans notre journal de mise à jour des données et comprendre quelles modifications ont été apportées à quelle date et quels en sont les effets. En outre, si nos clients souhaitent contester l'une de nos évaluations ou l'un de nos points de données, ils peuvent le faire directement par le biais de notre outil, qui lancera automatiquement un processus de révision et, s'il le juge approprié, déclenchera une mise à jour des données. Les processus entièrement connectés de bout en bout, y compris les mises à jour de données, qui sont rendus possibles par la technologie, font partie de notre philosophie.

Ángel Agudo : Permettez-moi d'ajouter une chose. La plate-forme logicielle comporte deux éléments. Le premier est la technologie qui nous permet de traiter toutes les données. Une fois que l'information est disponible, nous assurons la transparence, en combinant une vue descendante et ascendante, et en affichant la capacité d'aider les clients à comprendre et à utiliser les nouvelles données. La transparence consiste à informer les clients chaque fois que les données sont mises à jour. Nous fournissons également une vue descendante de tous les éléments qui ont été mis à jour de manière cohérente pour l'ensemble des produits, ainsi qu'une vue ascendante qui leur permet de comprendre ce qui s'est passé pour chaque point de données. Nous fournissons également des alertes et des rapports pour les aider à suivre les données. Enfin, nous fournissons quelque chose qui permet aux clients de comprendre ce qui a motivé la mise à jour des données. Il peut y avoir différentes raisons. C'est peut-être parce qu'une entreprise a publié un nouveau rapport sur le développement durable qui motive une mise à jour des informations pour une année donnée. Il se peut aussi que l'entreprise ait corrigé un point de données d'un rapport précédent. Quelle que soit la raison, il existe une capacité liée à l'enregistrement des données. Celle-ci signale non seulement que les données ont été mises à jour, mais aussi la raison pour laquelle un point de données a été mis à jour.

Chris Ciompi : D'accord. Permettez-moi d'insister un peu sur l'angle que vous venez d'aborder à propos des clients, n'est-ce pas ? Les clients qui l'utilisent, pensez-vous qu'ils voient la même valeur dans les trois dimensions dont vous venez de parler ?

Ángel Agudo : Les clients trouvent la vue descendante utile parce qu'elle regroupe ce qui a été mis à jour et facilite l'assimilation des informations. En même temps, ils ont besoin de pouvoir accéder à des points de données individuels lorsqu'ils effectuent une analyse plus granulaire. Donner la priorité à la vue descendante est très pertinent car elle donne un aperçu de ce qui a été mis à jour. La capacité d'explication granulaire est utile lorsque les clients ont besoin d'une analyse plus approfondie.

Chris Ciompi : J'ai compris. D'accord, très bien. Merci à tous.

Saisissez votre adresse électronique pour en savoir plus

Demander une démo