Foco de atención: Calidad de los datos - Dimensión 1, Cobertura

Calidad de datos 27 de abril de 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Serie de entrevistas con el equipo ejecutivo de Clarity AI sobre las 8 dimensiones de la calidad de datos

¿Cómo garantiza Clarity AI que sus datos son de la máxima calidad?

Clarity AI utiliza un marco de 8 dimensiones para garantizar la máxima calidad de los datos. Estas dimensiones son: cobertura, precisión, actualidad, actualización de datos, explicabilidad, coherencia, puntualidad y retroalimentación. En esta serie de entrevistas con ejecutivos de Clarity AI , se explora y explica cada una de estas dimensiones. Clarity AIEl equipo de expertos de la empresa crea metodologías científicas y basadas en pruebas que luego aprovechan la inteligencia artificial potente y escalable (por ejemplo, el aprendizaje automático) para recopilar, limpiar, analizar y ampliar los conjuntos de datos existentes para impulsar su plataforma tecnológica de sostenibilidad o para integrarlos directamente en los flujos de trabajo existentes de los usuarios.

Dimensión 1 - Cobertura

Clarity AIÁngel Agudo, Vicepresidente de Producto, Patricia Pina, Directora de Investigación e Innovación de Producto, Juan Diego Martín, Director de Estrategia de Datos, y Ron Potok, Director de Ciencia de Datos, debaten con Chris Ciompi, Director de Marketing de Clarity AI, la dimensión crítica de la cobertura y su relación con la calidad de los datos, así como la importancia de disponer de las capacidades adecuadas en IA para gestionar conjuntos de datos grandes y complejos. Una idea clave de la conversación fue la necesidad de metodologías y herramientas para pasar de los datos a la información, lo que permite extraer ideas de grandes cantidades de datos.

Otro punto importante destacado por los panelistas fue el impacto de la IA en el aumento de la calidad de los datos en lo que se refiere a la cobertura de datos, destacando la necesidad de capacidades de IA para navegar y gestionar eficazmente grandes volúmenes de información.

Chris Ciompi: Hablemos específicamente de la cobertura. Ángel, ¿puedes definir la cobertura en relación con la calidad de los datos?

Ángel Agudo: Lo imprescindible en cuanto a cobertura es asegurarnos de ofrecer la combinación adecuada de métricas que sean relevantes para nuestros clientes.

Chris Ciompi: ¿Por qué es importante la cobertura para los consumidores de datos de sostenibilidad?

Patricia Pina: Ofrecer una amplia cobertura es importante para garantizar que los distintos usuarios (con necesidades diferentes) tengan acceso a los datos de las empresas que son relevantes para ellos. Además, el universo de empresas relevantes es dinámico y puede cambiar, por lo que la cobertura ayuda a identificar posibles lagunas y a garantizar que los clientes no se pierdan nada importante.

Chris Ciompi: Juan Diego, ¿qué tan amplia es la cobertura que Clarity AI puede proporcionar?

Juan Diego Martín: Clarity AI ofrece actualmente una cobertura que oscila entre diferentes módulos. Tenemos módulos que incluyen entre 40.000 y 70.000 empresas. También tenemos la capacidad de hacer agregación de carteras, donde cubrimos 80.000 fondos primarios y más de 360.000 clases de acciones. La combinación de ambos es muy potente para que nuestros clientes evalúen sus carteras desde diferentes perspectivas.

Chris Ciompi: ¿Puedes hablar un poco más sobre por qué eso es tan poderoso?

Juan Diego Martín: Los clientes tienen problemas con datos que cubren parcialmente o bien la información de los fondos o bien la información de las empresas. Clarity AI es capaz de combinar y agregar esa información, viendo la composición final de una cartera, y proporcionar información a nivel de empresa, a nivel de fondo, a nivel de cartera, o incluso a nivel de entidad, a través de la agregación de todas las carteras dentro de una gestora concreta.

Chris Ciompi: Ron, ¿cómo influye la inteligencia artificial en la cantidad de cobertura que tiene Clarity AI ?

Ron Potok: Cuando hablamos de cobertura, primero pensamos en los datos comunicados. Las empresas publican informes de sostenibilidad, que suelen ser documentos PDF con datos no estructurados, como texto, imágenes y tablas. Podemos aprovechar la IA para extraer información de esos documentos de forma rápida y normalizada. La segunda forma en que podemos influir en la cobertura con el aprendizaje automático y la IA es modelando determinadas métricas que no todas las empresas comunican. Podemos mejorar enormemente la cobertura de determinadas métricas creando modelos de aprendizaje automático que correlacionen lo que hace una empresa con sus emisiones. Por ejemplo, podemos proporcionar estimaciones de CO2 para una gran parte de las empresas que no informan de sus emisiones de CO2.

Chris Ciompi: En cuanto al aprendizaje automático, ¿puede decirnos algo más sobre cómo se produce exactamente y si mejora con el tiempo?

Ron Potok: Cuando comenzamos en 2018, alrededor de 5.000 empresas informaron sobre las emisiones, pero ahora tenemos 8.000 empresas que informan. A medida que más empresas informan, nos permite aprender más sobre estas empresas y mejorar la precisión de nuestro modelo. En segundo lugar, mejoramos constantemente los modelos dotándolos de características más interesantes. Por ejemplo, ahora trabajamos con técnicas de imágenes por satélite para mejorar nuestros modelos de estimación, lo que amplía nuestra cobertura. Saber qué centrales eléctricas y fábricas de cemento producen emisiones nos ayuda a introducir datos más granulares y puntuales en los modelos para predecir con mayor precisión.

Chris Ciompi: Gracias, Ron. Patricia, ¿cómo ayuda la cobertura a impulsar la innovación de productos en Clarity AI?

Patricia Pina: Buscamos la eficiencia, la escalabilidad y el aprovechamiento de la tecnología para innovar a nivel de producto. Para los datos notificados, ofrecemos una trazabilidad completa de los puntos de datos hasta su fuente y enlaces a los informes. También utilizamos modelos de estimación y técnicas de aprendizaje automático para rellenar los huecos, y proporcionamos intervalos de confianza para cada modelo, así como cualquier detalle adicional sobre el tipo de modelo y estimación que ofrecemos. Esto permite a los clientes saber si la estimación es adecuada para su caso de uso. También innovamos en términos de recopilación de datos y servicios relacionados con la cobertura, en función de las necesidades cambiantes del mercado.

Chris Ciompi: ¿Puedes darme un ejemplo específico?

Patricia Pina: Claro. Por ejemplo, hemos creado un producto de inversión sostenible de extremo a extremo con una amplia cobertura porque disponíamos de los bloques de construcción necesarios. Tenemos el primer componente en nuestra Taxonomía de la UE o solución de los ODS, que mide y cuantifica la contribución de un cliente a los objetivos medioambientales y sociales. También tenemos una solución que proporciona valores para los indicadores de Principales Impactos Adversos requeridos para los informes deSFDR . Y tenemos un módulo de controversias o un módulo de exposiciones que da a los clientes una buena idea de las prácticas de gobernanza.

Chris Ciompi: Gracias, Patricia. Ángel, ¿puedes aclarar cómo afecta la cantidad de cobertura que tiene Clarity AI a las capacidades de su plataforma tecnológica?

Ángel Agudo: En mi opinión, lo crucial aquí es pasar de los datos a la información procesable. Sobre todo, cuando se gestionan grandes volúmenes de datos en diferentes organizaciones, métricas e industrias. Aquí es donde entran en juego las metodologías y las herramientas tecnológicas. Esto tiene dos vertientes. En primer lugar, necesitamos metodologías que nos ayuden a extraer información de los datos y, en segundo lugar, herramientas que nos ayuden a navegar y cribar esa información. Las herramientas deben ser capaces de desglosar la información en aspectos destacados y detallados, o viceversa, en función de las necesidades del usuario.

Introduzca su dirección de correo electrónico para leer más