Una serie di interviste con il team esecutivo di Clarity AI sulle 8 dimensioni della qualità dei dati
Come fa Clarity AI a garantire che i suoi dati siano della massima qualità?
Clarity AI utilizza una struttura a 8 dimensioni per garantire la massima qualità dei dati. Tali dimensioni sono: copertura, freschezza / tempestività, accuratezza, aggiornamento dei dati, spiegabilità, coerenza, puntualità e feedback. In questa serie di interviste ai dirigenti di Clarity AI , ciascuna di queste dimensioni viene esplorata e spiegata. Clarity AIIl team di esperti di crea metodologie scientifiche e basate su prove che poi sfruttano un'intelligenza artificiale potente e scalabile (ad esempio, l'apprendimento automatico) per raccogliere, pulire, analizzare ed espandere i set di dati esistenti per alimentare la sua piattaforma tecnologica per la sostenibilità o per integrarla direttamente nei flussi di lavoro esistenti degli utenti.
Dimensione 4 - Aggiornamenti dei dati
Clarity AIÁngel Agudo, VP Product, Patricia Pina, Head of Product Research & Innovation, Juan Diego Martin, Head of Data Strategy, e Ron Potok, Head of Data Science, discutono con Chris Ciompi, Chief Marketing Officer di Clarity AI, la dimensione critica dell'aggiornamento dei dati e la sua relazione con la qualità dei dati.
Chris Ciompi: Benvenuti a tutti. Iniziamo con te, Ángel. Potresti definire gli aggiornamenti dei dati, in relazione alla qualità dei dati?
Ángel Agudo: Gli aggiornamenti dei dati sono i processi che utilizziamo per incorporare nuove informazioni nello strumento. Si tratta di un aspetto critico della qualità dei dati: garantire la giusta frequenza per fornire i dati più freschi ai clienti, in modo che possano accedere alle informazioni più aggiornate disponibili.
Chris Ciompi: Capito. Patricia, perché gli aggiornamenti dei dati sono importanti per i consumatori di dati sulla sostenibilità?
Patricia Pina: L'infrastruttura e i processi che consentono l'aggiornamento dei dati sono fondamentali per i consumatori di dati sulla sostenibilità. I nostri clienti devono essere in grado di accedere alle informazioni più accurate e più recenti per le loro decisioni in qualsiasi momento. Clarity AI ha investito risorse significative per garantire che i nostri aggiornamenti dei dati possano essere distribuiti con frequenze diverse in base alla domanda dei clienti senza interrompere la loro esperienza e il servizio che forniamo loro. Ad esempio, i nostri clienti hanno bisogno di sapere immediatamente se c'è una nuova controversia su un caso di corruzione trapelato alla stampa, ma un'azienda comunica i dati sui gas serra solo su base annuale. Ciò richiede la capacità di modulare gli aggiornamenti dei dati in modo flessibile e tempestivo. Un altro aspetto molto importante dei nostri aggiornamenti dei dati è che non abbiamo bisogno di aspettare che tutte le aziende comunichino un valore aggiornato per rifletterlo nel nostro prodotto. Le aziende presenteranno i dati in momenti diversi, Clarity AI li raccoglierà e li metterà a disposizione dei nostri clienti non appena verranno pubblicati. Raccogliamo e aggiorniamo continuamente i dati per garantire ai nostri clienti l'utilizzo delle migliori informazioni disponibili in ogni specifico giorno.
Chris Ciompi: Grazie per questo. Ok, Juan Diego. Come fa Clarity AI a garantire che i suoi dati siano aggiornati?
Juan Diego Martín: Clarity AI ha un processo molto snello per, in primo luogo, rilevare quando le aziende aggiornano informazioni specifiche nei loro report e nelle fonti pubbliche. In secondo luogo, elabora queste informazioni il più rapidamente possibile e, in terzo luogo, dispone di un ulteriore livello di qualità dei dati che combina l'intelligenza artificiale e gli esseri umani, per assicurarsi che queste informazioni vengano fornite ai clienti nel miglior modo possibile. Tutto è collegato. Quando l'azienda aggiorna determinate informazioni, noi le stiamo già cercando. Di solito sappiamo quando verranno aggiornate: c'è un avviso o un segnale che ci permette di recuperare queste informazioni il prima possibile e di inserirle automaticamente nella pipeline di elaborazione che utilizziamo. Quindi, vengono passate attraverso i modelli di intelligenza artificiale costruiti dal team di Data Science, guidato da Ron. Poi vengono inserite in controlli di qualità specifici. Se c'è qualcosa che deve essere rivisto da un umano, abbiamo la persona giusta con le competenze giuste per rivedere questi dati. Dopo che tutto è stato fatto, c'è un ulteriore livello che ci permette di costruire le informazioni specifiche che vogliamo includere nel prodotto. Quindi, questo è ciò che ho definito un processo semplificato: rilevamento, ingestione, elaborazione, algoritmi umani, elaborazione e consegna allo strumento.
Chris Ciompi: Può dire qualcosa di più su come gli aggiornamenti dei dati di Clarity AI sono influenzati dall'intelligenza artificiale e su come l'IA influenza gli aggiornamenti dei dati?
Ron Potok: Ci sono in realtà due componenti. Una è l'efficienza sul versante della qualità, che garantisce che gli aggiornamenti dei dati che effettuiamo siano di alta qualità e frequenti. Il secondo punto è il nostro processo automatizzato per segnalare i punti di dati che sembrano sospetti, in modo che non arrivino mai al prodotto. Sono tutti processi automatizzati. Sono catturati da sofisticati modelli di apprendimento automatico, compreso il nostro modello di affidabilità di cui abbiamo parlato in una precedente conversazione. È tutto completamente automatizzato. In tempo reale, possiamo capire se un punto di dati è sospetto o meno e segnalarlo per un'ulteriore revisione manuale. Un altro elemento di differenziazione in termini di aggiornamento dei dati è il fatto di essere un'azienda tecnologica. Abbiamo sfruttato l'intelligenza artificiale per consentire un processo di copertura delle notizie molto più efficiente rispetto a molti dei nostri concorrenti. Questo ci permette di aggiornare molto frequentemente il nostro modulo di notizie per vedere le controversie ESG molto rapidamente e aumentare la frequenza di aggiornamento delle controversie, il che è molto diverso rispetto alla maggior parte dei nostri concorrenti nello spazio ESG. Questa capacità di aggiornare frequentemente le informazioni sulle notizie si basa sul nostro esclusivo processo di analisi delle controversie basato su modelli linguistici di grandi dimensioni condotti dall'uomo e dall'intelligenza artificiale.
Chris Ciompi: Ok, parliamo un po' più specificamente di controversie e PNL. Come funziona?
Ron Potok: Ogni giorno ingeriamo oltre 1,4 milioni di articoli da più di 30.000 fonti di notizie attendibili, che vengono elaborati automaticamente attraverso il nostro motore di notizie basato sull'intelligenza artificiale. Il nostro motore AI attribuisce, rileva e assegna in modo efficiente la gravità delle controversie ESG. I nostri analisti verificano poi i risultati e li mettono in produzione. L'utilizzo dell'IA rende il processo molto più efficiente e ci permette di trovare gli aghi nel pagliaio degli articoli.
Chris Ciompi: Vorrei solo fare una precisazione. Quindi l'intelligenza artificiale sta aumentando l'efficienza nella ricerca di elementi che devono poi essere esaminati da un esperto (umano) del nostro team.
Ron Potok: Corretto.
Chris Ciompi: Grazie. Ok, Patricia, in che modo gli aggiornamenti dei dati contribuiscono all'innovazione dei prodotti in Clarity AI?
Patricia Pina: In quanto azienda nativa digitale, ci impegniamo a implementare la trasparenza in un modo che sia incorporato nel nostro prodotto digitale e che sia accessibile e autoservito direttamente dai nostri clienti. Applichiamo lo stesso principio agli aggiornamenti dei nostri dati. Ogni cliente, in qualsiasi momento, può navigare nel nostro registro degli aggiornamenti dei dati e capire quali modifiche sono state apportate in quale data e i loro effetti. Inoltre, se i nostri clienti desiderano contestare una qualsiasi delle nostre valutazioni o dei nostri dati, possono farlo direttamente attraverso il nostro strumento, che avvierà automaticamente un processo di revisione e, se lo riterrà opportuno, attiverà un aggiornamento dei dati. I processi end-to-end completamente connessi, compresi gli aggiornamenti dei dati, abilitati dalla tecnologia, fanno parte della nostra filosofia.
Ángel Agudo: Mi permetta di aggiungere una cosa. La piattaforma software è composta da due elementi. Uno è la tecnologia che ci permette di elaborare tutti i dati. Una volta che le informazioni sono disponibili, forniamo trasparenza, combinando una visione dall'alto verso il basso e dal basso verso l'alto, e mostrando la capacità di aiutare i clienti a comprendere e utilizzare i nuovi dati. Trasparenza significa informare i clienti ogni volta che i dati vengono aggiornati. Forniamo anche una visione top-down di tutti gli elementi che sono stati aggiornati in modo coerente in tutti i prodotti, nonché una visione bottom-up che consente di capire cosa è successo nei singoli punti di dati. Forniamo anche avvisi e rapporti per aiutarli a tenere traccia dei dati. Infine, forniamo qualcosa che permetta ai clienti di capire cosa ha motivato l'aggiornamento dei dati. Le ragioni possono essere diverse. Forse perché un'azienda ha pubblicato un nuovo rapporto di sostenibilità che ha motivato l'aggiornamento delle informazioni per un determinato anno. Forse perché l'azienda ha corretto un dato di un rapporto precedente. Qualunque sia la ragione, c'è una funzionalità collegata al registro dei dati. Questo non solo segnala che i dati sono stati aggiornati, ma anche il motivo per cui un punto di dati è stato aggiornato.
Chris Ciompi: Ok. Mi permetta di insistere un po' sulla prospettiva che ha appena esposto riguardo ai clienti, giusto? I clienti che lo utilizzano, pensi che vedano la stessa quantità di valore in quelle tre dimensioni di cui hai appena parlato?
Ángel Agudo: I clienti trovano utile la vista dall'alto verso il basso perché aggrega ciò che è stato aggiornato e rende più facile digerire le informazioni. Allo stesso tempo, hanno bisogno di poter accedere ai singoli punti di dati quando si tratta di un'analisi più granulare. La priorità della vista dall'alto verso il basso è molto importante perché fornisce un'idea di ciò che è stato aggiornato. La spiegabilità granulare è utile quando i clienti devono fare un'analisi più approfondita.
Chris Ciompi: Capito. Ok, va bene. Grazie a tutti.