Riflettori puntati: Qualità dei dati - Dimensione 1, Copertura
Una serie di interviste con il team esecutivo di Clarity AI sulle 8 dimensioni della qualità dei dati
Come fa Clarity AI a garantire che i suoi dati siano della massima qualità?
Clarity AI utilizza una struttura a 8 dimensioni per garantire la massima qualità dei dati. Tali dimensioni sono: copertura, accuratezza, freschezza / tempestività, aggiornamento dei dati, spiegabilità, coerenza, puntualità e feedback. In questa serie di interviste ai dirigenti di Clarity AI , ciascuna di queste dimensioni viene esplorata e spiegata. Clarity AIIl team di esperti di crea metodologie scientifiche e basate su prove che poi sfruttano un'intelligenza artificiale potente e scalabile (ad esempio, l'apprendimento automatico) per raccogliere, pulire, analizzare ed espandere i set di dati esistenti per alimentare la sua piattaforma tecnologica per la sostenibilità o per integrarla direttamente nei flussi di lavoro esistenti degli utenti.
Dimensione 1 - Copertura
Clarity AIÁngel Agudo, VP Product, Patricia Pina, Head of Product Research & Innovation, Juan Diego Martín, Head of Data Strategy, e Ron Potok, Head of Data Science, discutono con Chris Ciompi, Chief Marketing Officer di Clarity AI, della dimensione critica della copertura e del suo rapporto con la qualità dei dati, nonché dell'importanza di disporre delle giuste capacità di IA per gestire insiemi di dati grandi e complessi. Un'idea chiave emersa dalla conversazione è stata la necessità di metodologie e strumenti per passare dai dati alle informazioni, consentendo di trarre approfondimenti da grandi quantità di dati.
Un altro punto importante sottolineato dai relatori è stato l'impatto dell'IA nell'aumentare la qualità dei dati in relazione alla loro copertura, evidenziando la necessità di capacità di IA per navigare e gestire efficacemente elevati volumi di informazioni.
Chris Ciompi: Parliamo nello specifico della copertura. Ángel, puoi definire la copertura in relazione alla qualità dei dati?
Ángel Agudo: Il must della copertura è garantire la giusta combinazione di metriche rilevanti per i nostri clienti.
Chris Ciompi: Perché la copertura è importante per i consumatori di dati sulla sostenibilità?
Patricia Pina: Offrire un'ampia copertura è importante per garantire che utenti diversi (con esigenze diverse) abbiano accesso ai dati delle società che sono rilevanti per loro. Inoltre, l'universo delle aziende rilevanti è dinamico e può cambiare, quindi la copertura aiuta a identificare potenziali lacune e a garantire che i clienti non si perdano nulla di importante.
Chris Ciompi: Juan Diego, quanto è ampia la copertura che Clarity AI può fornire?
Juan Diego Martín: Attualmente Clarity AI offre una copertura che spazia tra diversi moduli. Abbiamo moduli che includono da 40.000 a 70.000 società. Abbiamo anche la possibilità di aggregare i portafogli, coprendo 80.000 fondi primari e oltre 360.000 classi di azioni. La combinazione di questi moduli è estremamente potente per i nostri clienti, che possono valutare i loro portafogli da diverse prospettive.
Chris Ciompi: Puoi parlare un po' di più del perché è così potente?
Juan Diego Martín: I clienti hanno problemi con dati che coprono parzialmente le informazioni sui fondi o sulle società. Clarity AI è in grado di combinare e aggregare tali informazioni, guardando alla composizione finale di un portafoglio, e di fornire informazioni a livello di società, di fondo, di portafoglio o persino di entità, attraverso l'aggregazione di tutti i portafogli all'interno di uno specifico asset manager.
Chris Ciompi: Ron, in che modo la quantità di copertura di Clarity AI è influenzata dall'intelligenza artificiale?
Ron Potok: Quando parliamo di copertura, pensiamo innanzitutto ai dati riportati. Le aziende pubblicano rapporti di sostenibilità e questi rapporti sono in genere documenti PDF con dati non strutturati, tra cui testo, immagini e tabelle. Possiamo sfruttare l'intelligenza artificiale per estrarre informazioni in modo rapido e normalizzato da questi documenti. Il secondo modo in cui possiamo incidere sulla copertura con l'apprendimento automatico e l'IA è la modellazione di alcune metriche che non tutte le aziende riportano. Possiamo migliorare notevolmente la copertura di alcune metriche costruendo modelli di apprendimento automatico che mettono in relazione le attività di un'azienda con le sue emissioni. Ad esempio, possiamo fornire stime di CO2 per un'ampia frazione di aziende che non dichiarano le proprie emissioni di CO2.
Chris Ciompi: Per quanto riguarda l'apprendimento automatico, puoi dire qualcosa di più su come avviene esattamente e se migliora nel tempo?
Ron Potok: Quando abbiamo iniziato nel 2018, circa 5.000 aziende hanno comunicato le emissioni, ma ora ne abbiamo 8.000. Un numero sempre maggiore di aziende che comunicano, ci permette di conoscere meglio queste aziende e di migliorare l'accuratezza del nostro modello. In secondo luogo, miglioriamo costantemente i modelli dotandoli di caratteristiche più interessanti. Per esempio, ora stiamo lavorando con tecniche di immagini satellitari per migliorare i nostri modelli di stima, ampliando così la nostra copertura. Sapere quali sono le centrali elettriche e i cementifici che producono emissioni ci aiuta a inserire nei modelli dati più granulari e tempestivi per fare previsioni più accurate.
Chris Ciompi: Grazie, Ron. Patricia, in che modo la copertura aiuta a promuovere l'innovazione dei prodotti in Clarity AI?
Patricia Pina: Puntiamo all'efficienza, alla scalabilità e a sfruttare la tecnologia per innovare a livello di prodotto. Per quanto riguarda i dati riportati, offriamo la piena tracciabilità dei punti di dati fino alla loro fonte e i link ai report. Utilizziamo anche modelli di stima e tecniche di apprendimento automatico per colmare le lacune e forniamo intervalli di confidenza per ogni modello, oltre a qualsiasi dettaglio aggiuntivo sul tipo di modello e di stima che offriamo. In questo modo i clienti possono capire se la stima è adatta al loro caso d'uso. Innoviamo anche in termini di raccolta dati e servizi correlati per la copertura, in base alle mutevoli esigenze del mercato.
Chris Ciompi: Può farmi un esempio specifico?
Patricia Pina: Certo. Per esempio, abbiamo costruito un prodotto di investimento sostenibile end-to-end con un'ampia copertura perché avevamo già pronti gli elementi necessari. Abbiamo il primo elemento della nostra tassonomia UE o soluzione SDGs, che misura e quantifica il contributo del cliente agli obiettivi ambientali e sociali. Abbiamo anche una soluzione che fornisce valori per i principali indicatori di impatto negativo richiesti per la rendicontazione suSFDR . Abbiamo anche un modulo per le controversie o per le esposizioni che fornisce ai clienti un'idea delle pratiche di governance.
Chris Ciompi: Grazie, Patricia. Ángel, puoi chiarire in che modo la quantità di copertura di Clarity AI influisce sulle capacità della sua piattaforma tecnologica?
Ángel Agudo: A mio parere, l'aspetto cruciale è passare dai dati alle informazioni utilizzabili. Soprattutto quando si gestiscono grandi volumi di dati tra organizzazioni, metriche e settori diversi. È qui che entrano in gioco le metodologie e gli strumenti tecnologici. Ci sono due aspetti da considerare. In primo luogo, abbiamo bisogno di metodologie che ci aiutino a estrarre informazioni dai dati e, in secondo luogo, di strumenti che ci aiutino a navigare e a setacciare le informazioni. Gli strumenti devono essere in grado di suddividere le informazioni in punti salienti e dettagli, o viceversa, a seconda delle esigenze dell'utente.