Foco de atención: Calidad de los datos - Dimensión 8, Comentarios

Calidad de los datos 20 de julio de 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Serie de entrevistas con el equipo ejecutivo de Clarity AI sobre las 8 dimensiones de la calidad de datos

¿Cómo garantiza Clarity AI que sus datos son de la máxima calidad?

Clarity AI utiliza un marco de 8 dimensiones para garantizar la máxima calidad de los datos. Estas dimensiones son: cobertura, actualidad, exactitud, actualización de datos, explicabilidad, coherencia, puntualidad y retroalimentación. En esta serie de entrevistas con ejecutivos de Clarity AI , se explora y explica cada una de estas dimensiones. Clarity AIEl equipo de expertos de la empresa crea metodologías científicas y basadas en pruebas que luego aprovechan una inteligencia artificial potente y escalable (por ejemplo, el aprendizaje automático) para recopilar, limpiar, analizar y ampliar los conjuntos de datos existentes con el fin de impulsar su plataforma tecnológica de sostenibilidad o integrarla directamente en los flujos de trabajo existentes de los usuarios.

Dimensión 8 - Feedback

Clarity AIÁngel Agudo, Vicepresidente de Producto, Patricia Pina, Directora de Investigación e Innovación de Producto, Juan Diego Martín, Director de Estrategia de Datos, y Ron Potok, Director de Ciencia de Datos, debaten con Chris Ciompi, Director de Marketing de Clarity AI, la dimensión crítica de la retroalimentación y su relación con la calidad de los datos. 

Chris Ciompi: Hola de nuevo, equipo. Hoy hablamos del feedback en relación con la calidad de los datos. Ángel, ¿puedes explicarnos la relación entre el feedback y la calidad de los datos?

Ángel Agudo: Por supuesto. Mejorar la calidad de los datos es un proceso iterativo, y tenemos que asegurarnos de captar cualquier posible comentario sobre nuestros datos. Es esencial mantener un canal abierto con nuestros clientes, para que puedan proporcionar información adicional o plantear inquietudes sobre un punto de datos. De este modo, podemos aprender de ellos y ofrecer explicaciones adicionales o resolver rápidamente cualquier problema.

Chris Ciompi: Entiendo. ¿Podría explicar el proceso para recibir comentarios?

Ángel Agudo: Claro, dentro de nuestra herramienta, hay una opción para comunicar comentarios para cada punto de datos. Los usuarios pueden seleccionar una respuesta predeterminada o incluir su propio mensaje para plantear sus dudas o aportar información adicional. Una vez que recibimos el feedback del cliente, ponemos en marcha nuestros procesos internos para actuar en consecuencia o proporcionar una explicación que ayude al usuario a entender mejor los datos. Si identificamos un error, reaccionamos inmediatamente para corregir el punto de datos.

Chris Ciompi: Gracias por la aclaración. Patricia, ¿por qué es importante la retroalimentación para los consumidores de datos de sostenibilidad?

Patricia Pina: Como se ha mencionado en entrevistas anteriores, los consumidores de datos de sostenibilidad necesitan confiar en los datos para sentirse cómodos utilizándolos en sus procesos de toma de decisiones. En el sector de la gestión de activos, por ejemplo, a menudo hablamos con analistas de investigación fundamental que conocen a fondo las empresas que cubrimos. Evaluarán nuestros datos en función de sus conocimientos previos sobre esa empresa y cuestionarán todo lo que no les parezca correcto. Es fundamental que dispongan de un canal de fácil acceso, donde puedan compartir sus preguntas y obtener respuestas. En algunos casos nos encontramos con diferencias sobre cómo definen los clientes algunos conceptos relacionados con la sostenibilidad. Utilicemos el ejemplo de las exposiciones: ¿se trata de empresas dedicadas a actividades típicamente controvertidas, como el tabaco, el alcohol o los combustibles fósiles? Los distintos clientes tienen formas diferentes de definir lo que constituye una exposición cuando se trata de filiales financieras, filiales operativas o inversiones minoritarias. Estos matices se descubren a menudo cuando se cuestionan datos específicos de empresas concretas a través de los mecanismos de retroalimentación. Estas conversaciones nos ayudan a garantizar que nuestros productos satisfacen las necesidades de los clientes. El resultado de estas conversaciones suele ser ampliar y añadir más flexibilidad y personalización a nuestros productos.

Chris Ciompi: Estupendo. Juan Diego, ¿puedes explicarnos cómo Clarity AI garantiza que sus datos incorporan comentarios?

Juan Diego Martín: Sí, además de canales como nuestro consejo asesor de clientes y las conversaciones continuas con nuestros clientes, tenemos una función que permite recibir comentarios instantáneos sobre datos que faltan o discrepancias en los datos. Abordamos inmediatamente cualquier problema y a menudo descubrimos que se debe a enfoques metodológicos diferentes. Nos sentamos con nuestros clientes para garantizar la alineación y aprendemos de cualquier comentario que recibimos.

Chris Ciompi: ¿Me puede dar un ejemplo de algo que ha llegado a través de los últimos tiempos que de alguna manera ilustra sobre lo que acabas de decir?

Juan Diego Martín: Sí, hay casos en los que, por ejemplo, nuestro cliente utiliza otro proveedor e identifica discrepancias en los datos. Hemos podido identificar que los datos se extrajeron de un año anterior y se atribuyeron al año en curso sin previo aviso ni explicación. O tal vez la información se comunicó para el total de CO2, pero no se comunicó el desglose entre el Alcance 1 y el Alcance 2. En ese caso, el otro proveedor no estaba en condiciones de comunicar los datos. En ese caso, el otro proveedor no era transparente, mientras que nosotros nos aseguramos de mencionarlo explícitamente. En una ocasión, nos pusimos en contacto con un conocido proveedor de datos e identificamos 400 puntos de datos que contenían errores metodológicos. Esto es algo que ocurre continuamente. Volviendo a mi ejemplo de los datos que se comunicaban como globales pero faltaban las emisiones: esto es algo importante y tiene un impacto en la puntuación de esta empresa. Es una conversación que yo diría que tenemos todas las semanas.

Chris Ciompi: Genial, perfecto. Gracias, Ron. Ron te toca a ti. ¿Cómo influye la información que recibimos sobre la calidad de los datos en la IA, o cómo influye la IA en eso?

Ron Potok: En primer lugar, creo que tal vez replantear la retroalimentación como la capacidad de respuesta podría ser útil. En mi opinión, ¿cuál es nuestra capacidad de respuesta ante una solicitud o un cambio en comparación con nuestros competidores y con los estándares del sector? Tenemos algunos canales de respuesta, y hemos mencionado un poco acerca de ser capaz de desafiar o hacer preguntas acerca de los puntos de datos específicos. En nuestra aplicación web se puede acceder a los datos en bruto asociados y cuestionarlos. Esas impugnaciones son muy rápidas. Una de las cosas únicas que tenemos es, por ejemplo, en nuestro motor de noticias de controversias, tenemos una gran capacidad de respuesta a las controversias que se pierden o se clasifican erróneamente. Esos ejemplos mejoran nuestro modelo. Así que utilizaremos esos ejemplos para que el modelo no solo los corrija inmediatamente a través de los humanos, sino que luego el modelo aprenderá de esos ejemplos y no volverá a cometer el mismo error. Ese es un ejemplo muy importante de cómo incluimos los comentarios de clientes, usuarios y humanos en la mejora para que la próxima vez, el modelo aprenda un poco más sobre la controversia. ¿Cuál es su gravedad? ¿Cómo se atribuye? Otro ejemplo de capacidad de reacción ha sido nuestra ventaja a la hora de responder a los cambios normativos. Eso es un inciso, pero algo en lo que Clarity AI ha sido muy bueno es en mantenerse al día con los últimos cambios en la regulación, y ejemplos de ello son nuestro producto SFDR .

Chris Ciompi: Vamos a hablar de la retroalimentación que viene de los reguladores y la retroalimentación que no está directamente relacionada con nuestros datos, sino con el ecosistema en el que estamos jugando. ¿Cómo funciona nuestro sistema al respecto?

Ron Potok: Creo que hay muchas maneras de ver esto. Empezaré por cómo lo hacemos nosotros. Algunos de los PAI [Principal Impacto Adverso] de SFDR , por ejemplo, estaban relacionados con polémicas de empresas que sufren, por ejemplo, sobornos, corrupción o ponen en peligro la biodiversidad. Esos son buenos ejemplos de indicadores de Principal Impacto Adverso en los que el regulador dijo: "Sí, las noticias pueden proporcionar información sobre empresas que estén infringiendo esos PAI". Pero fue muy específico en el lenguaje de las violaciones, ¿verdad? Los reguladores en lugar de mapearlo exactamente a Clarity AI's definición de un incidente de soborno y corrupción, utilizaron un lenguaje muy específico. En lugar de tener que formar a miles de analistas para que releyeran todos los artículos asociados a esos incidentes y los etiquetaran como infracciones del PAI o no, volvimos a entrenar el modelo para que etiquetara los artículos adecuadamente, de acuerdo con las últimas directrices normativas. Pero, además, tuvimos que evaluar el nivel de infracción. Pudimos hacerlo muy rápidamente y proporcionar una cobertura muy alta y una información muy oportuna en muy poco tiempo.

Chris Ciompi: Es un ángulo muy interesante a la retroalimentación y no uno que creo que viene a la mente de inmediato cuando oímos retroalimentación. Pensamos que es de persona a persona en lugar de, ya sabes, el ecosistema está realmente cambiando y dando retroalimentación sobre lo que tenemos que hacer. Bueno, cualquier otra forma en que los comentarios de los clientes influiría en lo que luego vemos en realidad en la propia plataforma de software.

Ángel Agudo: Creo que la conexión más clara es a través del proceso que he descrito antes. Captamos el feedback de todos nuestros clientes para cada una de las características todo el tiempo que se incluye en nuestro proceso de validación del producto, descubrimiento de nuevas características y, en última instancia, la incorporación de nuevas funcionalidades.

Chris Ciompi: ¿Hay algo sobre la retroalimentación en un módulo dentro de la plataforma que pueda afectar a todos los módulos?

Ángel Agudo: Volviendo al el punto sobre la coherenciacreo que está claro que, por ejemplo, cuando hay una dimensión que se ve afectada por los comentarios, inmediatamente hacemos los cambios necesarios en todos los módulos. Puede ser sobre los datos en sí, sobre la metodología...

Chris Ciompi: Lo que estoy oyendo es que, desde la perspectiva del cliente, hay una garantía de que si se cambia un módulo, se calibra con bastante rapidez, si no instantáneamente, con otros módulos. A diferencia de si tuviéramos diferentes equipos humanos haciendo cada módulo o partes de cada módulo, que no pueden surgir desde un punto de vista de gobierno hasta el próximo trimestre. Todo claro. Quiero hacer una pregunta más sobre esto. Hay algo acerca de la escala, ¿verdad? Ya se trate de una pieza de retroalimentación de un cliente o de retroalimentación que viene del ecosistema, con los reglamentos cambiantes. ¿Cómo puede nuestra plataforma hacer frente a todas estas cosas a escala?

Ángel Agudo: Podemos dividir esto en partes. Una es la operativa. Cuando captamos diferentes puntos de vista, por ejemplo, cuando hablamos con los clientes, podemos recibir información de varios clientes al mismo tiempo y sobre el mismo tema. Utilizamos la tecnología para que nos ayude a reunir todo de la manera más eficaz, agregar la información y evaluar los distintos puntos de vista para tomar una decisión oportuna. Desde el punto de vista del proceso, se trata de trasladar sistemáticamente esa información a la herramienta. Hemos construido la herramienta de forma que conecte todas las piezas, y la tecnología nos ayuda a incorporar inmediatamente las opiniones en todos y cada uno de los lugares en los que se encuentra ese punto de datos, métrica o empresa específicos dentro de la plataforma.

Chris Ciompi: ¡Gracias a todos por los comentarios!

Introduzca su dirección de correo electrónico para leer más