Foco de atención: Calidad de datos - Dimensión 4, Actualización de datos

Calidad de los datos 1 de junio de 2023 Ángel Agudo, Patricia Pina, Juan Diego Martin, Ron Potok, Chris Ciompi

Serie de entrevistas con el equipo ejecutivo de Clarity AI sobre las 8 dimensiones de la calidad de datos

¿Cómo garantiza Clarity AI que sus datos son de la máxima calidad?

Clarity AI utiliza un marco de 8 dimensiones para garantizar la máxima calidad de los datos. Estas dimensiones son: cobertura, actualidad, exactitud, actualización de datos, explicabilidad, coherencia, puntualidad y retroalimentación. En esta serie de entrevistas con ejecutivos de Clarity AI , se explora y explica cada una de estas dimensiones. Clarity AIEl equipo de expertos de la empresa crea metodologías científicas y basadas en pruebas que luego aprovechan una inteligencia artificial potente y escalable (por ejemplo, el aprendizaje automático) para recopilar, limpiar, analizar y ampliar los conjuntos de datos existentes con el fin de impulsar su plataforma tecnológica de sostenibilidad o integrarla directamente en los flujos de trabajo existentes de los usuarios.

Dimensión 4 - Actualización de datos

Clarity AIÁngel Agudo, Vicepresidente de Producto, Patricia Pina, Directora de Investigación e Innovación de Producto, Juan Diego Martín, Director de Estrategia de Datos, y Ron Potok, Director de Ciencia de Datos, debaten con Chris Ciompi, Director de Marketing de Clarity AI, la dimensión crítica de la actualización de datos y su relación con la calidad de los mismos. 

Chris Ciompi: Bienvenidos a todos. Empecemos contigo, Ángel. ¿Podrías definir la actualización de datos en relación con la calidad de los datos?

Ángel Agudo: Las actualizaciones de datos son los procesos que utilizamos para incorporar nueva información a la herramienta. Se trata de un aspecto crítico de la calidad de los datos: garantizar que tenemos la frecuencia adecuada para ofrecer los datos más frescos a los clientes, de modo que puedan acceder a la información más actualizada disponible.

Chris Ciompi: Entendido. Patricia, ¿por qué son importantes las actualizaciones de datos para los consumidores de datos de sostenibilidad?

Patricia Pina: La infraestructura y los procesos que permiten actualizar los datos son fundamentales para los consumidores de datos de sostenibilidad. Nuestros clientes necesitan poder acceder en todo momento a la información más precisa y reciente que sea relevante para sus decisiones. Clarity AI ha invertido importantes recursos en garantizar que nuestras actualizaciones de datos puedan desplegarse con distintas frecuencias en función de la demanda de los clientes sin perturbar su experiencia ni el servicio que les prestamos. Por ejemplo, nuestros clientes necesitan saber inmediatamente si hay una nueva polémica sobre un caso de corrupción que se ha filtrado a la prensa, pero una empresa sólo comunicará los datos de GEI anualmente. Esto requiere tener la capacidad de modular las actualizaciones de datos de manera flexible y oportuna. Otro aspecto muy importante de nuestras actualizaciones de datos es que no tenemos que esperar a que todas las empresas comuniquen un valor actualizado para reflejarlo en nuestro producto. Las empresas informarán en diferentes momentos, Clarity AI recogerá esos datos y los pondrá a disposición de nuestros clientes a medida que se publiquen. Estamos continuamente recopilando y actualizando los datos para garantizar que nuestros clientes puedan hacer uso de la mejor información disponible en cada día concreto.

Chris Ciompi: Gracias por eso. Bien, Juan Diego. ¿Cómo se asegura Clarity AI de que sus datos están actualizados?

Juan Diego Martín: Clarity AI cuenta con un proceso muy ágil para, en primer lugar, detectar cuándo las empresas actualizan información específica en sus informes y fuentes públicas. En segundo lugar, procesar esa información lo más rápidamente posible y, en tercer lugar, contar con una capa adicional de calidad de datos que combina IA y humanos, para asegurarse de que esta información se entrega a los clientes de la mejor manera posible. Todo está conectado. Cuando la empresa actualiza determinada información, nosotros ya estamos buscando esa información. Normalmente sabemos cuándo se va a actualizar: hay una alerta o señal que nos permite recuperar esta información lo antes posible e ingerirla automáticamente en el canal de procesamiento que utilizamos. Por lo tanto, pasa por modelos de IA construidos por el equipo de Ciencia de Datos, dirigido por Ron. A continuación, se incluye en controles de calidad específicos. Si hay algo que necesita ser revisado por un ser humano, tenemos a la persona adecuada con las habilidades adecuadas para revisar estos datos. Después de que todo está hecho, hay una capa adicional que nos permite construir información específica que queremos incluir en el producto. Así pues, esto es a lo que me refería como un proceso racionalizado: detección, ingestión, procesamiento, algoritmos humanos, procesamiento y entrega a la herramienta.

Chris Ciompi: ¿Puede explicarnos un poco más cómo la inteligencia artificial influye en la actualización de datos en Clarity AI ?

Ron Potok: En realidad tiene dos componentes. Uno es la eficiencia en el aspecto de la calidad, garantizando que las actualizaciones de datos que hacemos son de alta calidad y frecuentes. El segundo es nuestro proceso automatizado para marcar los puntos de datos que parecen sospechosos, de modo que nunca lleguen al producto. Se trata de procesos automatizados. Son capturados por sofisticados modelos de aprendizaje automático, incluyendo nuestro modelo de fiabilidad que hemos hablado en una conversación anterior. Todo está totalmente automatizado. Más o menos en tiempo real, podemos ver si un punto de datos es sospechoso o no y marcarlo para una revisión manual posterior. Otro factor diferenciador que tenemos en términos de actualización de datos es que somos una empresa tecnológica. Hemos aprovechado la IA para hacer posible un proceso de cobertura de noticias mucho más eficiente que el de muchos de nuestros competidores. Esto nos permite actualizar con mucha frecuencia nuestro módulo de noticias para ver las controversias ESG muy rápidamente y aumentar la frecuencia de actualización de las controversias, lo que es muy diferente en comparación con la mayoría de nuestros competidores en el espacio ESG. Esta capacidad de actualizar con frecuencia la información de las noticias se basa en nuestro exclusivo proceso de controversias basado en modelos de lenguaje de gran tamaño con bucle humano y de IA.

Chris Ciompi: Bien, hablemos un poco más específicamente sobre controversias y PNL. ¿Cómo está funcionando?

Ron Potok: Cada día ingerimos más de 1,4 millones de artículos de más de 30.000 fuentes de noticias fiables, que se procesan automáticamente a través de nuestro motor de noticias basado en IA. Nuestro motor de IA atribuye, detecta y asigna gravedad a las controversias ASG. A continuación, nuestros analistas verifican los resultados y los ponen en producción. El uso de la IA hace que el proceso sea mucho más eficiente y nos permite encontrar las agujas en el pajar de los artículos.

Chris Ciompi: Sólo quiero hacer una aclaración. La inteligencia artificial aumenta la eficiencia a la hora de encontrar cosas que luego deben ser revisadas por un experto (humano) de nuestro equipo.

Ron Potok: Correcto.

Chris Ciompi: Gracias. Patricia, ¿cómo contribuye la actualización de datos a la innovación de productos en Clarity AI?

Patricia Pina: Como empresa nativa digital, nos comprometemos a aplicar la transparencia de forma que esté integrada en nuestro producto digital y nuestros clientes puedan acceder a ella y autogestionarla directamente. Aplicamos el mismo principio a nuestras actualizaciones de datos. Cualquier cliente puede navegar en cualquier momento por nuestro registro de actualización de datos y comprender qué cambios se hicieron en qué fecha y sus efectos. Además, si nuestros clientes desean cuestionar alguna de nuestras evaluaciones o puntos de datos, pueden hacerlo directamente a través de nuestra herramienta, que iniciará automáticamente un proceso de revisión y, si lo considera oportuno, activará una actualización de datos. Los procesos totalmente conectados de principio a fin, incluida la actualización de datos, que permite la tecnología, forman parte de nuestra filosofía.

Ángel Agudo: Permítanme añadir una cosa aquí. La plataforma de software consta de dos partes. Una es la tecnología que nos permite procesar todos los datos. Una vez que la información está ahí, proporcionamos transparencia, combinando una visión descendente y ascendente, y mostrando la capacidad de ayudar a los clientes a comprender y utilizar los nuevos datos. Transparencia significa informar a los clientes cada vez que se actualizan los datos. También proporcionamos una visión descendente de todas las piezas que se han actualizado de forma coherente en todos los productos, así como una visión ascendente que les permite comprender lo que ha sucedido en puntos de datos individuales. También proporcionamos alertas e informes para ayudarles a hacer un seguimiento de los datos. Por último, proporcionamos algo que permite a los clientes comprender qué ha motivado la actualización de los datos. Puede haber diferentes razones. Quizá sea porque una empresa ha publicado un nuevo informe de sostenibilidad que motiva una actualización de la información de un año determinado. Puede ser que la empresa haya corregido un dato de un informe anterior. Sea cual sea el motivo, hay una capacidad que está conectada al registro de datos. Esto no sólo indica que los datos se han actualizado, sino también la razón por la que se ha actualizado un punto de datos.

Chris Ciompi: Muy bien. Permíteme insistir un poco en el punto de vista que acabas de exponer sobre los clientes, ¿verdad? Los clientes que lo utilizan, ¿crees que ven la misma cantidad de valor en esas tres dimensiones de las que acabas de hablar?

Ángel Agudo: A los clientes les resulta útil la vista descendente porque agrega lo que se ha actualizado y facilita la digestión de la información. Al mismo tiempo, necesitan la capacidad de ir a puntos de datos individuales cuando están en un análisis más granular. Dar prioridad a la vista descendente es muy relevante porque proporciona una idea de lo que se ha actualizado. La capacidad de explicación granular es útil cuando los clientes necesitan hacer un análisis más profundo.

Chris Ciompi: Entendido. Bien, de acuerdo. Gracias a todos.

Introduzca su dirección de correo electrónico para leer más