Uma série de entrevistas com a equipa executiva do Clarity AI sobre as 8 dimensões da qualidade dos dados
Como é que Clarity AI garante que os seus dados são da mais elevada qualidade?
Clarity AI utiliza um quadro de 8 dimensões para garantir que os dados são da mais elevada qualidade. Essas dimensões são a cobertura, a exactidão, a actualidade, as actualizações de dados, a explicabilidade, a consistência, o ponto no tempo e o feedback. Nesta série de entrevistas com executivos de Clarity AI , cada uma destas dimensões é explorada e explicada. Clarity AIA equipa de especialistas da cria metodologias científicas e baseadas em evidências que, em seguida, utilizam inteligência artificial poderosa e escalável (por exemplo, aprendizagem automática) para recolher, limpar, analisar e expandir conjuntos de dados existentes para alimentar a sua plataforma tecnológica de sustentabilidade ou para integrar directamente nos fluxos de trabalho existentes dos utilizadores.
Dimensão 1 - Cobertura
Clarity AIÁngel Agudo, Director de Investigação e Inovação de Produtos, Patricia Pina, Director de Estratégia de Dados, Juan Diego Martín, e Ron Potok, Director de Ciência de Dados, debatem - com Chris Ciompi, Director de Marketing de Clarity AI- a dimensão crítica da cobertura e a sua relação com a qualidade dos dados, bem como a importância de dispor das capacidades certas em IA para gerir conjuntos de dados grandes e complexos. Uma das principais conclusões da conversa foi a necessidade de metodologias e ferramentas para passar dos dados para a informação, permitindo retirar conclusões de grandes quantidades de dados.
Outro ponto importante salientado pelos participantes no painel foi o impacto da IA no aumento da qualidade dos dados no que diz respeito à cobertura de dados, destacando a necessidade de capacidades de IA para navegar e gerir eficazmente grandes volumes de informação.
Chris Ciompi: Vamos falar especificamente da cobertura. Ángel, podes definir cobertura no que diz respeito à qualidade dos dados?
Ángel Agudo: O que é obrigatório no que respeita à cobertura é garantir que oferecemos a combinação certa de métricas que são relevantes para os nossos clientes.
Chris Ciompi: Porque é que a cobertura é importante para os consumidores de dados sobre sustentabilidade?
Patricia Pina: Oferecer uma cobertura alargada é importante para garantir que diferentes utilizadores (com diferentes necessidades) têm acesso aos dados das empresas que são relevantes para eles. Além disso, o universo de empresas relevantes é dinâmico e pode mudar, pelo que a cobertura ajuda a identificar potenciais lacunas e a garantir que os clientes não estão a perder nada de importante.
Chris Ciompi: Juan Diego, qual é o âmbito da cobertura que o Clarity AI pode oferecer?
Juan Diego Martín: Actualmente, a Clarity AI oferece uma cobertura que varia entre diferentes módulos. Temos módulos que incluem 40.000 a 70.000 empresas. Também temos a capacidade de fazer a agregação de carteiras, onde cobrimos 80.000 fundos primários e mais de 360.000 classes de acções. A combinação destes módulos é extremamente poderosa para os nossos clientes avaliarem as suas carteiras a partir de diferentes perspectivas.
Chris Ciompi: Podes falar um pouco mais sobre o porquê de isso ser tão poderoso?
Juan Diego Martín: Os clientes têm problemas com dados que cobrem parcialmente a informação sobre os fundos ou a informação sobre as empresas. Clarity AI é capaz de combinar e agregar essa informação, olhando para a composição final de uma carteira, e fornecer informação ao nível da empresa, ao nível do fundo, ao nível da carteira, ou mesmo ao nível da entidade, através da agregação de todas as carteiras dentro de um gestor de activos específico.
Chris Ciompi: Ron, de que forma é que a quantidade de cobertura que o Clarity AI tem é influenciada pela inteligência artificial?
Ron Potok: Quando falamos de cobertura, pensamos primeiro nos dados comunicados. As empresas publicam relatórios de sustentabilidade, e esses relatórios são normalmente documentos PDF com dados não estruturados, incluindo texto, imagens e tabelas. Podemos aproveitar a IA para extrair informações de forma rápida e normalizada desses documentos. A segunda forma de influenciarmos a cobertura com a aprendizagem automática e a IA é modelando determinadas métricas que nem todas as empresas comunicam. Podemos melhorar significativamente a cobertura de determinadas métricas através da criação de modelos de aprendizagem automática que correlacionem as acções de uma empresa com as suas emissões. Por exemplo, podemos fornecer estimativas de CO2 para uma grande fração das empresas que não comunicam as suas emissões de CO2.
Chris Ciompi: No que diz respeito à aprendizagem automática, pode dizer-nos um pouco mais sobre a forma exacta como isso está a acontecer e se melhora com o tempo?
Ron Potok: Quando começámos em 2018, cerca de 5 000 empresas comunicaram emissões, mas agora temos 8 000 empresas a comunicar. O facto de haver mais empresas a comunicar as emissões permite-nos saber mais sobre essas empresas e melhorar a precisão do nosso modelo. Em segundo lugar, estamos constantemente a melhorar os modelos, dotando-os de características mais interessantes. Por exemplo, estamos agora a trabalhar com técnicas de imagens de satélite para melhorar os nossos modelos de estimativa, o que alarga a nossa cobertura. Saber quais as centrais eléctricas e fábricas de cimento que estão a produzir emissões ajuda-nos a obter dados mais granulares e atempados para os modelos, de modo a prever com maior precisão.
Chris Ciompi: Obrigado, Ron. Patricia, como é que a cobertura ajuda a impulsionar a inovação de produtos em Clarity AI?
Patricia Pina: Procuramos a eficiência, a escalabilidade e o aproveitamento da tecnologia para inovar ao nível do produto. Relativamente aos dados comunicados, oferecemos total rastreabilidade dos pontos de dados até à sua fonte e ligações aos relatórios. Também utilizamos modelos de estimativa e técnicas de aprendizagem automática para preencher as lacunas, e fornecemos intervalos de confiança para cada modelo, bem como quaisquer detalhes adicionais sobre o tipo de modelo e estimativa que oferecemos. Isto permite que os clientes compreendam se a estimativa é adequada para o seu caso de utilização. Também inovamos em termos de recolha de dados e serviços relacionados com a cobertura, em função da evolução das necessidades do mercado.
Chris Ciompi: Pode dar-me um exemplo específico?
Patricia Pina: Claro. Por exemplo, criámos um produto de investimento sustentável completo com uma ampla cobertura porque dispúnhamos dos elementos necessários. Temos o primeiro elemento da nossa Taxonomia da UE ou solução ODS, que mede e quantifica a contribuição de um cliente para os objectivos ambientais e sociais. Dispomos também de uma solução que fornece valores para os indicadores dos Principais Impactos Adversos exigidos pelos relatóriosSFDR . E temos um módulo de controvérsias ou um módulo de exposições que dá aos clientes uma boa noção das práticas de governação.
Chris Ciompi: Obrigado, Patrícia. Ángel, pode esclarecer como é que a quantidade de cobertura que Clarity AI tem afecta as capacidades da sua plataforma tecnológica?
Ángel Agudo: Na minha opinião, o que é crucial aqui é passar dos dados para a informação accionável. Especialmente, quando se gerem grandes volumes de dados em diferentes organizações, métricas e sectores. É aqui que entram as metodologias e as ferramentas de base tecnológica. Há duas partes nesta questão. Em primeiro lugar, precisamos de metodologias que ajudem a extrair informações dos dados e, em segundo lugar, de ferramentas que ajudem a navegar e a analisar essas informações. As ferramentas têm de ser capazes de dividir a informação em destaques e detalhes, ou vice-versa, dependendo das necessidades do utilizador.