Pleins feux sur la qualité des données : Qualité des données - Dimension 8, Retour d'information

Qualité des données 20 juillet 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Une série d'entretiens avec l'équipe de direction de Clarity AI sur les 8 dimensions de la qualité des données

Comment Clarity AI s'assure-t-il que ses données sont de la plus haute qualité ?

Clarity AI utilise un cadre en huit dimensions pour garantir la qualité optimale des données. Ces dimensions sont la couverture, la fraîcheur / l'actualité, l' exactitude, la mise à jour des données, l'explicabilité, la cohérence, le point dans le temps et le retour d'information. Dans cette série d'entretiens avec des dirigeants de Clarity AI , chacune de ces dimensions est explorée et expliquée. Clarity AIL'équipe d'experts de l'entreprise crée des méthodologies scientifiques et factuelles qui s'appuient ensuite sur une intelligence artificielle puissante et évolutive (par exemple, l'apprentissage automatique) pour collecter, nettoyer, analyser et étendre les ensembles de données existants afin d'alimenter sa plateforme technologique de durabilité ou de l'intégrer directement dans les flux de travail existants des utilisateurs.

Dimension 8 - Retour d'information

Clarity AIÁngel Agudo, vice-président chargé des produits, Patricia Pina, responsable de la recherche et de l'innovation en matière de produits, Juan Diego Martin, responsable de la stratégie des données, et Ron Potok, responsable de la science des données, discutent avec Chris Ciompi, directeur général du marketing de Clarity AI, de la dimension critique du retour d'information et de sa relation avec la qualité des données. 

Chris Ciompi : Bonjour à nouveau à toute l'équipe. Nous parlons aujourd'hui du retour d'information et de la qualité des données. Ángel, pouvez-vous nous expliquer la relation entre le retour d'information et la qualité des données ?

Ángel Agudo : Bien sûr. L'amélioration de la qualité des données est un processus itératif, et nous devons nous assurer que nous saisissons tout retour d'information potentiel sur nos données. Il est essentiel de maintenir un canal ouvert avec nos clients, afin qu'ils puissent fournir des informations supplémentaires ou faire part de leurs préoccupations concernant un point de données. De cette façon, nous pouvons apprendre d'eux et fournir des explications supplémentaires ou résoudre rapidement tout problème.

Chris Ciompi : Je comprends. Pourriez-vous expliquer le processus de réception des commentaires ?

Ángel Agudo : Bien sûr, dans notre outil, il y a une option pour signaler un retour d'information pour chaque point de données. Les utilisateurs peuvent sélectionner une réponse prédéterminée ou inclure leur propre message pour faire part de leurs préoccupations ou fournir des informations supplémentaires. Une fois que nous recevons les commentaires du client, nous mettons en place nos processus internes pour y donner suite ou fournir une explication afin d'aider l'utilisateur à mieux comprendre les données. Si nous identifions une erreur, nous réagissons immédiatement pour corriger le point de données.

Chris Ciompi : Merci pour cette précision. Patricia, pourquoi le retour d'information est-il important pour les consommateurs de données sur le développement durable ?

Patricia Pina : Comme nous l'avons mentionné dans les entretiens précédents, les consommateurs de données sur le développement durable doivent avoir confiance dans ces données pour pouvoir les utiliser dans leurs processus de prise de décision. Dans le secteur de la gestion d'actifs, par exemple, nous nous adressons souvent à des analystes de recherche fondamentale qui connaissent très bien les entreprises que nous couvrons. Ils évaluent nos données par rapport à leurs antécédents sur l'entreprise en question et remettent en question tout ce qui ne leur semble pas correct. Il est essentiel qu'ils disposent d'un canal facile d'accès, où ils peuvent poser leurs questions et obtenir des réponses. Dans certains cas, nous rencontrons des différences dans la manière dont les clients définissent certains concepts liés au développement durable. Prenons l'exemple des expositions : les entreprises sont-elles engagées dans des activités typiquement controversées telles que le tabac, l'alcool ou les combustibles fossiles ? Les clients n'ont pas tous la même façon de définir ce qui constitue une exposition lorsqu'il s'agit de filiales financières, de filiales opérationnelles ou d'investissements minoritaires. Ces nuances sont souvent mises en évidence lorsque des points de données spécifiques à certaines entreprises sont remis en question par le biais des mécanismes de retour d'information. Ces discussions nous aident à nous assurer que nos produits répondent aux besoins des clients. Le résultat de ces conversations permet souvent d'étendre et d'ajouter plus de flexibilité et de personnalisation à nos produits.

Chris Ciompi : Très bien. Juan Diego, pouvez-vous nous expliquer comment Clarity AI s'assure que ses données intègrent le retour d'information ?

Juan Diego Martín : Oui, en plus des canaux tels que notre comité consultatif des clients et les conversations permanentes avec nos clients, nous disposons d'une fonction qui permet un retour d'information instantané sur les données manquantes ou les divergences de données. Nous traitons immédiatement les problèmes et nous constatons souvent qu'ils sont dus à des approches méthodologiques différentes. Nous nous assoyons avec nos clients pour garantir l'alignement et nous tirons des enseignements de tous les retours d'information que nous recevons.

Chris Ciompi : Pouvez-vous me donner un exemple de quelque chose qui s'est produit récemment et qui illustre d'une certaine manière ce que vous venez de dire ?

Juan Diego Martín : Oui, il y a des cas où, par exemple, notre client utilise un autre fournisseur et identifie des divergences dans les données. Nous avons pu constater que les données avaient été extraites d'une année précédente et attribuées à l'année en cours sans préavis ni explication. Ou peut-être que les informations ont été communiquées pour le total des émissions de CO2, mais que la répartition entre le champ d'application 1 et le champ d'application 2 n'a pas été communiquée. Dans ce cas, l'autre fournisseur n'était pas transparent, alors que nous veillons à ce qu'il soit explicitement mentionné. Une fois, nous avons contacté un fournisseur de données bien connu et nous avons identifié 400 points de données qui comportaient des erreurs méthodologiques. C'est quelque chose qui se produit continuellement. Pour en revenir à mon exemple de données déclarées comme globales mais sans les émissions, il s'agit d'une chose importante qui a un impact sur le score de cette entreprise. Je dirais que c'est une conversation que nous avons chaque semaine.

Chris Ciompi : Très bien, parfait. Je vous remercie. Ron vous laisse la parole. Comment les commentaires que nous recevons sur la qualité des données influencent-ils l'IA, ou comment l'IA influence-t-elle cela ?

Ron Potok : Tout d'abord, je pense qu'il serait peut-être utile de reformuler le retour d'information en termes de réactivité. À mon avis, quelle est notre réactivité à une demande ou à un changement par rapport à nos concurrents et aux normes de l'industrie ? Nous disposons de certains canaux de réponse, et nous avons mentionné un peu la possibilité de contester ou de poser des questions sur des points de données spécifiques. En effet, dans notre application web, vous pouvez accéder aux données brutes qui y sont associées et les contester. Ces contestations sont très rapides. L'une de nos particularités est que, par exemple, dans notre moteur d'information sur les controverses, nous avons une très grande réactivité face aux controverses manquées ou mal classées. Ces exemples améliorent en fait notre modèle. Nous utilisons donc ces exemples pour que le modèle les corrige immédiatement par l'intermédiaire des humains, mais aussi pour que le modèle apprenne de ces exemples et ne commette plus la même erreur. C'est un exemple très important de la manière dont nous incluons le feedback des clients, des utilisateurs et des humains dans l'amélioration, de sorte que la prochaine fois, le modèle en apprendra un peu plus sur la controverse. Quelle est sa gravité ? Comment est-elle attribuée ? Un autre exemple de réactivité a été notre avantage à répondre aux changements réglementaires. C'est une parenthèse, mais Clarity AI a toujours su se tenir au courant des dernières modifications de la réglementation, comme en témoigne notre produit SFDR .

Chris Ciompi : Parlons du retour d'information provenant des régulateurs et du retour d'information qui n'est pas directement lié à nos données mais à l'écosystème dans lequel nous jouons. Comment notre système fonctionne-t-il à cet égard ?

Ron Potok : Je pense qu'il y a plusieurs façons d'envisager la question. Je commencerai par la manière dont nous procédons. Certains des PAI [Principal Adverse Impact] du site SFDR , par exemple, étaient liés à des controverses concernant des entreprises qui subissaient, par exemple, des pots-de-vin, de la corruption ou qui mettaient en péril la biodiversité. Ce sont là de bons exemples d'indicateurs d'impact négatif principal pour lesquels l'autorité de régulation a déclaré : "Oui, les nouvelles peuvent fournir des informations sur les problèmes de santé et de sécurité : "Oui, les nouvelles peuvent fournir des informations sur les entreprises qui enfreignent ces IAP". Mais la formulation des violations était très spécifique, n'est-ce pas ? Les régulateurs ont utilisé un langage très spécifique, plutôt que de le faire correspondre exactement à la définition de Clarity AId'un incident de corruption. Au lieu de devoir former des milliers d'analystes pour relire tous les articles associés à ces incidents et les étiqueter, qu'il s'agisse ou non d'une violation de l'IAP, nous avons réappris au modèle à étiqueter les articles de manière appropriée, conformément aux dernières directives réglementaires. En outre, nous avons dû évaluer le niveau de violation. Nous avons pu le faire très rapidement et fournir une couverture très élevée et des informations très opportunes dans un laps de temps très court.

Chris Ciompi : C'est un point de vue très intéressant sur le retour d'information et ce n'est pas celui qui nous vient immédiatement à l'esprit lorsque nous entendons parler de retour d'information. Nous pensons qu'il s'agit d'une relation de personne à personne plutôt que d'un écosystème qui est en train de changer et de nous donner un retour sur ce que nous devons faire. D'accord, y a-t-il d'autres façons dont le retour d'information des clients pourrait influencer ce que nous voyons ensuite dans la plateforme logicielle elle-même ?

Ángel Agudo : Je pense que le lien le plus clair se trouve dans le processus que j'ai décrit précédemment. Nous recueillons les commentaires de tous nos clients pour chaque caractéristique, tout le temps, qui est incluse dans notre processus de validation du produit, de découverte de nouvelles caractéristiques et, en fin de compte, d'incorporation de nouvelles fonctionnalités.

Chris Ciompi : Y a-t-il quelque chose qui concerne le retour d'information dans un module de la plateforme et qui peut affecter tous les modules ?

Ángel Agudo : Pour en revenir à l'aspect la question de la cohérenceJe crois qu'il est clair que, par exemple, lorsqu'une dimension est affectée par un retour d'information, nous apportons immédiatement les changements nécessaires dans tous les modules. Cela peut concerner les données en tant que telles, la méthodologie...

Chris Ciompi : Ce que j'entends, c'est que, du point de vue du client, il y a une assurance que si un module est modifié, il est calibré assez rapidement, voire instantanément, avec d'autres modules. Par contre, si nous avions différentes équipes humaines qui s'occupaient de chaque module ou de certaines parties de chaque module, cela pourrait ne pas être pris en compte du point de vue de la gouvernance jusqu'au prochain trimestre. Tout est clair. J'aimerais poser une dernière question à ce sujet. Il y a quelque chose à propos de l'échelle, n'est-ce pas ? Qu'il s'agisse d'un retour d'information d'un client ou d'un retour d'information provenant de l'écosystème, avec l'évolution des réglementations. Comment notre plateforme peut-elle répondre à toutes ces questions à l'échelle ?

Ángel Agudo : Nous pouvons diviser cette question en plusieurs parties. Le premier est d'ordre opérationnel. Lorsque nous recueillons différents points de vue, par exemple lorsque nous discutons avec des clients, il se peut que nous recevions des informations en retour de plusieurs clients en même temps et sur le même sujet. Nous utilisons la technologie pour nous aider à tout rassembler de la manière la plus efficace possible, à agréger les informations et à évaluer les différents points de vue afin de prendre une décision opportune. Du point de vue du processus, il s'agit de traduire systématiquement ce retour d'information dans l'outil. Nous avons conçu l'outil de manière à ce qu'il relie tous les éléments, et la technologie nous aide à incorporer immédiatement le retour d'information à chaque endroit où ce point de données spécifique, cette mesure ou cette entreprise se trouve dans la plateforme.

Chris Ciompi : Merci à tous pour vos commentaires !

Saisissez votre adresse électronique pour en savoir plus

Demander une démo