Pleins feux sur la qualité des données : Qualité des données - Dimension 7, Point dans le temps
Une série d'entretiens avec l'équipe de direction de Clarity AI sur les 8 dimensions de la qualité des données
Comment Clarity AI s'assure-t-il que ses données sont de la plus haute qualité ?
Clarity AI utilise un cadre en huit dimensions pour garantir la qualité optimale des données. Ces dimensions sont la couverture, la fraîcheur / l'actualité, l' exactitude, la mise à jour des données, l'explicabilité, la cohérence, le point dans le temps et le retour d'information. Dans cette série d'entretiens avec des dirigeants de Clarity AI , chacune de ces dimensions est explorée et expliquée. Clarity AIL'équipe d'experts de l'entreprise crée des méthodologies scientifiques et factuelles qui s'appuient ensuite sur une intelligence artificielle puissante et évolutive (par exemple, l'apprentissage automatique) pour collecter, nettoyer, analyser et étendre les ensembles de données existants afin d'alimenter sa plateforme technologique de durabilité ou de l'intégrer directement dans les flux de travail existants des utilisateurs.
Dimension 7 - Point dans le temps
Clarity AIÁngel Agudo, vice-président chargé des produits, Patricia Pina, responsable de la recherche et de l'innovation en matière de produits, Juan Diego Martin, responsable de la stratégie des données, et Ron Potok, responsable de la science des données, discutent, avec Chris Ciompi, directeur général du marketing de Clarity AI, de la dimension critique du point dans le temps et de sa relation avec la qualité des données.
Chris Ciompi : Merci encore à tous d'avoir pris le temps de discuter d'une autre dimension de la qualité des données. La prochaine est le point dans le temps. Ángel, pourriez-vous définir le point dans le temps en ce qui concerne la qualité des données ?
Ángel Agudo : Le point dans le temps est la capacité de voir les différentes valeurs que nous fournissons à travers le temps pour les mesures, les organisations, les gouvernements... et comment elles évoluent. Notre plateforme fournit des mises à jour en temps réel. Par exemple, les nouvelles identifiées sur les entreprises peuvent être fréquentes, ce qui affecte la perception et l'analyse de l'entreprise. Les informations ponctuelles vous permettent de voir quelles sont les fluctuations au sein de l'entreprise qui peuvent se produire en raison de ces événements en temps réel.
Chris Ciompi : Vous parlez de fluctuations en temps réel et de les juxtaposer à un point dans le temps, pouvez-vous expliquer cela à nouveau ?
Ángel Agudo : Bien sûr. Nous définissons le point dans le temps comme la combinaison d'informations qui se produit chaque fois que nous mettons à jour les informations. Nous fournissons les données dont nous disposons sur les organisations, qui peuvent avoir une fréquence très faible, comme les mises à jour annuelles des informations communiquées par l'entreprise, ou une fréquence élevée qui peut provenir d'autres sources d'information qui ne sont pas nécessairement fournies par l'entreprise, comme les rapports d'actualité émanant des ONG. Tous ces éléments motiveront des changements au sein de l'entreprise en ce qui concerne les indicateurs individuels ou la perception générale de l'entreprise.
Chris Ciompi : Merci. D'accord, Patricia. Pourquoi le point dans le temps est-il important pour les consommateurs de données sur le développement durable ?
Patricia Pina : Il est essentiel pour nos clients de comprendre le parcours des entreprises en matière de développement durable et de savoir où elles se situent à différents moments. Si nous nous concentrons, par exemple, sur la nécessité de décarboniser notre économie, il ne suffit pas de comprendre quelles sont les entreprises qui émettent peu de carbone aujourd'hui. La vraie question intéressante est celle des entreprises à fortes émissions qui commencent leur parcours de décarbonisation et qui gagnent du terrain. Pour décarboniser l'économie réelle, il faut identifier et soutenir ces entreprises fortement émettrices dans leur transition ; ce n'est qu'en évaluant l'évolution de la trajectoire des émissions des entreprises à différents moments que nous pouvons le faire. De même, le point dans le temps permet à nos clients d'identifier les entreprises qui ne sont pas encore en train de se décarboniser, afin qu'ils puissent créer des stratégies d'engagement.
Chris Ciompi : Merci, Patricia. Juan Diego, comment Clarity AI s'assure-t-il que ses données intègrent le point dans le temps en tant que dimension de la qualité des données ?
Juan Diego Martín : Pour comprendre ce qui était disponible à un moment donné dans le passé, nous devons combiner deux choses : les données et les processus. En ce qui concerne les données, tout doit être rattaché à un horodatage, à une signature et au moment où ces données ont été publiées, recherchées, traitées et exposées au client. Cela permet de combiner différentes fréquences de données, où les nouvelles peuvent changer instantanément et la capitalisation boursière peut changer tous les jours ou toutes les minutes, tandis que les informations sur les politiques et les réglementations peuvent prendre plus de temps à être mises à jour. L'autre élément dont nous tenons compte est l'existence de processus robustes face à des éléments susceptibles d'affecter la capacité à reconstruire cette image dans le passé. Par exemple, si une entreprise change de nom ou si des fusions ont lieu, nous devons être prêts à combiner les informations et à fournir une vue précise de ce qui était disponible à un moment donné.
Chris Ciompi : D'accord, reprenons cet exemple. Vous venez de mentionner qu'un point de données est rapporté, et qu'un an plus tard, ce point de données est reformulé. Comment notre système, comment le point dans le temps fonctionne-t-il dans ce scénario ?
Juan Diego Martín : Donc, si nous considérons la vue historique par opposition à la vue ponctuelle, nous devrions utiliser l'information retraitée parce qu'elle fournit la vue la plus précise des résultats de l'entreprise à ce moment précis. Mais si nous considérons le moment présent, ce que nous essayons de comprendre, c'est quelle information était disponible à un moment donné, et nous devons alors utiliser l'information non restreinte pour que l'information publiée à l'origine ait un sens.
Chris Ciompi : Merci. Ron, comment l'intelligence artificielle influence-t-elle le point dans le temps sur le site Clarity AI ?
Ron Potok : Prenons un exemple clair et précis, celui des émissions du champ d'application 3. Pourquoi le champ d'application 3 est-il spécial ? Parce qu'il est très difficile d'en rendre compte. Sa déclaration n'est pas encore normalisée. De nombreuses entreprises ne déclarent pas tous les champs du champ d'application 3 qui sont extrêmement pertinents pour leur secteur d'activité. Le manque de normalisation et de maturité du champ d'application 3 nous oblige donc à effectuer un contrôle supplémentaire, et quel est ce contrôle supplémentaire ? Nous utilisons notre estimation du champ d'application 3 et la comparons aux données déclarées, et nous avons la possibilité de remplacer les données déclarées par notre estimation en raison du manque de cohérence et de maturité des données déclarées du champ d'application 3. Je pense donc que c'est le seul et unique cas où le point dans le temps a une grande influence sur nos modèles d'estimation. Par ailleurs, comme nous l'avons évoqué dans un épisode précédent de cette série, le programme d'information incorpore le point dans le temps pour modifier les scores ESG.
Chris Ciompi : Pouvez-vous nous en dire un peu plus ?
Ron Potok : Nous permettons aux nouvelles controverses d'influencer les décisions que vous prenez dès que possible. Dès que nous trouvons ces données, nous les traitons sur notre plateforme de manière très efficace. Ainsi, vous ne subissez pas l'influence d'une controverse un mois après qu'elle s'est produite. Nous voulons que vous puissiez savoir que nos scores ESG reflètent le véritable risque ESG ou la durabilité associée à l'entreprise à ce moment-là.
Chris Ciompi: Je comprends. Merci à tous !