أضواء كاشفة: جودة البيانات - البعد 8، التغذية الراجعة

جودة البيانات 20 يوليو، 2023 أنخيل أجودو ، باتريشيا بينا ، خوان دييغو مارتن ، رون بوتوك ، كريس سيومبي

سلسلة مقابلات مع Clarity AI الفريق التنفيذي المعني بالأبعاد ال 8 لجودة البيانات

كيف Clarity AI تأكد من أن بياناتها من أعلى مستويات الجودة؟

Clarity AI يستخدم إطار عمل 8 أبعاد لضمان أن تكون البيانات من أعلى مستويات الجودة. هذه الأبعاد هي التغطية ، والنضارة / التوقيت ، والدقة ، وتحديثات البيانات ، وقابلية التفسير ، والاتساق ، والنقطة الزمنية ، والتعليقات. في هذه السلسلة من المقابلات مع Clarity AI المديرين التنفيذيين ، يتم استكشاف كل من هذه الأبعاد وشرحها. Clarity AIيقوم فريق الخبراء بإنشاء منهجيات علمية وقائمة على الأدلة تستفيد بعد ذلك من الذكاء الاصطناعي القوي والقابل للتطوير (مثل التعلم الآلي) لجمع مجموعات البيانات الحالية وتنظيفها وتحليلها وتوسيعها لتشغيل منصة تكنولوجيا الاستدامة الخاصة بها أو للاندماج مباشرة في سير العمل الحالي للمستخدمين.

البعد 8 - التغذية الراجعة

Clarity AIنائب رئيس المنتج ، أنخيل أجودو ، رئيس أبحاث المنتجات والابتكار ، باتريشيا بينا ، رئيس استراتيجية البيانات ، خوان دييغو مارتن ، ورئيس علوم البيانات ، رون بوتوك ، يناقشون - مع كريس سيومبي ، Clarity AIالرئيس التنفيذي للتسويق - البعد الحاسم للتعليقات وعلاقتها بجودة البيانات. 

كريس سيومبي: مرحبا مرة أخرى ، فريق. نحن نتحدث عن التعليقات اليوم من حيث صلتها بجودة البيانات. أنخيل ، هل يمكنك شرح العلاقة بين التعليقات وجودة البيانات؟

Ángel Agudo: طبعًا. يعد تحسين جودة البيانات عملية تكرارية ، ونحن بحاجة إلى التأكد من أننا نلتقط أي تعليقات محتملة حول بياناتنا. من الضروري الحفاظ على قناة مفتوحة مع عملائنا ، حتى يتمكنوا من تقديم معلومات إضافية أو إثارة مخاوف بشأن نقطة البيانات. بهذه الطريقة ، يمكننا التعلم منهم وتقديم تفسيرات إضافية أو معالجة أي مشكلات بسرعة.

كريس سيومبي: أفهم. هل يمكنك شرح عملية تلقي التعليقات؟

Ángel Agudo: بالتأكيد ، ضمن أداتنا ، هناك خيار للإبلاغ عن التعليقات لكل نقطة بيانات. يمكن للمستخدمين تحديد إجابة محددة مسبقا أو تضمين رسالتهم الخاصة للتعبير عن مخاوفهم أو تقديم معلومات إضافية. بمجرد أن نتلقى تعليقات من العميل ، نضع عملياتنا الداخلية للعمل عليها ، أو تقديم تفسير لمساعدة المستخدم على فهم البيانات بشكل أفضل. إذا حددنا خطأ ، فإننا نتفاعل على الفور لتصحيح نقطة البيانات.

كريس سيومبي: شكرا لك على التوضيح. باتريشيا ، لماذا تعتبر التعليقات مهمة لمستهلكي بيانات الاستدامة؟

باتريشيا بينا: كما ذكرنا في المقابلات السابقة ، يحتاج مستهلكو بيانات الاستدامة إلى الوثوق بالبيانات ليشعروا بالراحة عند استخدامها في عمليات صنع القرار الخاصة بهم. في صناعة إدارة الأصول ، على سبيل المثال ، غالبا ما نتحدث إلى محللي الأبحاث الأساسية الذين هم على دراية عميقة بالشركات التي نغطيها. سيقومون بتقييم بياناتنا مقابل أسلافهم في تلك الشركة وسيتحدون كل ما لا يبدو صحيحا لهم. من الأهمية بمكان أن يكون لديهم قناة يسهل الوصول إليها ، حيث يمكنهم مشاركة أسئلتهم والحصول على إجابات. في بعض الحالات ، نواجه اختلافات حول كيفية تعريف العملاء لبعض المفاهيم المتعلقة بالاستدامة. دعنا نستخدم مثال التعرض: هل تشارك الشركات في أنشطة مثيرة للجدل عادة مثل التبغ أو الكحول أو الوقود الأحفوري؟ لدى العملاء المختلفين طرق مختلفة لتحديد ما يشكل تعرضا عندما يتعلق الأمر بالشركات المالية التابعة أو الشركات التابعة العاملة أو استثمارات الأقلية. غالبا ما يتم الكشف عن هذه الفروق الدقيقة عندما يتم تحدي نقاط بيانات محددة لشركات معينة من خلال آليات التغذية الراجعة. تساعدنا هذه المناقشات على ضمان تلبية منتجاتنا لاحتياجات العملاء. غالبا ما يتم توسيع ناتج هذه المحادثات وإضافة المزيد من المرونة والتخصيص لمنتجاتنا.

كريس سيومبي: عظيم. خوان دييغو ، هل يمكنك شرح كيف Clarity AI يضمن أن بياناته تتضمن ردود الفعل؟

خوان دييغو مارتين: نعم ، بالإضافة إلى قنوات مثل المجلس الاستشاري للعملاء والمحادثات المستمرة مع عملائنا ، لدينا ميزة تسمح بتعليقات فورية على البيانات المفقودة أو تناقضات البيانات. نعالج على الفور أي مشكلات وغالبا ما نجد أنها ناتجة عن مناهج منهجية مختلفة. نجلس مع عملائنا لضمان التوافق ونتعلم من أي ملاحظات نتلقاها.

كريس سيومبي: هل يمكن أن تعطيني مثالا على شيء ظهر مؤخرا يوضح بطريقة ما ما قلته للتو؟

خوان دييغو مارتين: نعم ، هناك حالات يستخدم فيها عميلنا ، على سبيل المثال ، مزودا آخر ويحددون التناقضات في البيانات. لقد تمكنا من تحديد أن البيانات تم سحبها من سنة سابقة ونسبت إلى العام الحالي دون إشعار أو تفسير. أو ربما تم الإبلاغ عن المعلومات لإجمالي CO2 ، ولكن لم يتم الإبلاغ عن الانقسام بين النطاق 1 والنطاق 2. في هذه الحالة ، لم يكن المزود الآخر شفافا ، بينما نتأكد من ذكره صراحة. ذات مرة ، تواصلنا مع مزود بيانات معروف ، وحددنا 400 نقطة بيانات بها أخطاء منهجية. هذا شيء يحدث باستمرار. بالعودة إلى المثال الخاص بي للبيانات التي تم الإبلاغ عنها على أنها عالمية ولكنها تفتقد الانبعاثات: هذا شيء كبير وله تأثير على درجة هذه الشركة. هذه محادثة أود أن أقول إننا نجريها كل أسبوع.

كريس سيومبي: عظيم ، مثالي. شكرا. رون لك. كيف تؤثر التعليقات التي نتلقاها حول جودة البيانات على الذكاء الاصطناعي ، أو كيف تؤثر الذكاء الاصطناعي على ذلك؟

رون بوتوك: أولا ، أعتقد أنه ربما يكون من المفيد إعادة صياغة التعليقات كاستجابة. لذا في نظري ، ما مدى استجابتنا لطلب أو تغيير مقارنة بمنافسينا ومقارنة بمعايير الصناعة؟ لدينا بعض القنوات للرد ، وقد ذكرنا قليلا عن القدرة على التحدي أو طرح أسئلة حول نقاط بيانات محددة. هذا لأنه في تطبيق الويب الخاص بنا ، يمكنك الوصول إلى البيانات الأولية المرتبطة به وتحديه. تلك التحديات سريعة جدا. أحد الأشياء الفريدة التي لدينا ، على سبيل المثال ، في محرك أخبار الخلافات لدينا ، لدينا استجابة عالية جدا للخلافات التي يتم تفويتها أو تصنيفها بشكل خاطئ. هذه الأمثلة في الواقع تحسن نموذجنا. لذلك سنستخدم هذه الأمثلة حتى لا يقوم النموذج بتصحيحها على الفور من خلال البشر فحسب ، ولكن بعد ذلك سيتعلم النموذج من تلك الأمثلة ولن يرتكب نفس الخطأ مرة أخرى. هذا مثال مهم جدا على كيفية تضمين تعليقات العملاء والمستخدمين والبشر في التحسين بحيث يتعلم النموذج في المرة القادمة المزيد عن الجدل. ما هي شدة ذلك؟ كيف يتم إسناده؟ مثال آخر على الاستجابة هو ميزتنا في الاستجابة للتغييرات التنظيمية. لذلك هذا جانبا ، ولكن شيء Clarity AI لقد كان جيدا جدا في مواكبة أحدث التغييرات في التنظيم ، ومن الأمثلة على ذلك SFDR حاصل الضرب.

كريس سيومبي: دعنا نتحدث عن التعليقات التي تأتي من المنظمين والتعليقات التي لا تتعلق مباشرة ببياناتنا ولكن بالنظام البيئي الذي نلعب فيه. كيف يعمل نظامنا على ذلك؟

رون بوتوك: أعتقد أن هناك العديد من الطرق للنظر في هذا. سأبدأ بكيفية قيامنا بذلك. بعض من SFDR فعلى سبيل المثال، كانت تلك المتعلقة بالخلافات من الشركات التي تمر، على سبيل المثال، بالرشوة أو الفساد أو تعريض التنوع البيولوجي للخطر. هذه أمثلة جيدة على مؤشرات التأثير السلبي الرئيسية حيث قال المنظم: "نعم ، يمكن أن توفر الأخبار معلومات عن الشركات التي تنتهك تلك ال PAIs". لكنها كانت محددة للغاية بشأن لغة الانتهاكات ، أليس كذلك؟ المنظمون بدلا من تعيينها بالضبط إلى Clarity AIتعريف حادث الرشوة والفساد ، استخدم لغة محددة للغاية. بدلا من الحاجة إلى تدريب الآلاف من المحللين على إعادة قراءة جميع المقالات المرتبطة بهذه الحوادث ووضع علامة عليها سواء كانت انتهاكا ل PAI أم لا ، قمنا بإعادة تدريب النموذج لوضع علامة على المقالات بشكل مناسب ، بما يتماشى مع أحدث الإرشادات التنظيمية. ولكن بعد ذلك ، علاوة على ذلك ، كان علينا تقييم مستوى الانتهاك. لقد تمكنا من القيام بذلك بسرعة كبيرة وتوفير تغطية عالية جدا ومعلومات في الوقت المناسب جدا في فترة زمنية قصيرة جدا.

كريس سيومبي: إنها زاوية مثيرة للاهتمام حقا للتعليقات وليست زاوية أعتقد أنها تتبادر إلى الذهن على الفور عندما نسمع ردود الفعل. نعتقد أنه من شخص لآخر بدلا من ، كما تعلمون ، النظام البيئي يتغير بالفعل ويعطي ملاحظات حول ما نحتاج إلى القيام به. حسنا ، أي طرق أخرى ستؤثر بها ملاحظات العملاء على ما نراه بالفعل في النظام الأساسي للبرنامج نفسه.

Ángel Agudo: أعتقد أن الاتصال الأكثر وضوحا هو من خلال العملية التي وصفتها من قبل. نحن نلتقط ملاحظات جميع عملائنا لكل ميزة على حدة طوال الوقت يتم تضمينها في عملية التحقق من صحة المنتج ، واكتشاف ميزات جديدة ، وفي النهاية دمج وظائف جديدة.

كريس سيومبي: هل هناك أي شيء يتعلق بالتعليقات في وحدة واحدة داخل النظام الأساسي قد يؤثر على جميع الوحدات؟

Ángel Agudo: بالعودة إلى النقطة المتعلقة بالاتساق ، أعتقد أنه من الواضح ، على سبيل المثال ، عندما يكون هناك بعد واحد يتأثر بالتعليقات ، فإننا نجري على الفور التغييرات اللازمة عبر جميع الوحدات. يمكن أن يكون على البيانات في حد ذاتها ، على المنهجية ...

كريس سيومبي: ما أسمعه هو أنه ، من منظور العميل ، هناك تأكيد على أنه إذا تم تغيير وحدة واحدة ، معايرتها بسرعة إلى حد ما ، إن لم يكن على الفور ، مع وحدات أخرى. مقابل ما إذا كان لدينا فرق بشرية مختلفة تقوم بكل وحدة أو أجزاء من كل وحدة ، فقد لا يأتي ذلك من وجهة نظر الحوكمة حتى الربع التالي. الكل واضح. أريد أن أطرح سؤالا آخر حول هذا الموضوع. هناك شيء ما حول الحجم ، أليس كذلك؟ سواء كانت قطعة واحدة من التعليقات من عميل واحد أو التعليقات القادمة من النظام البيئي ، مع تغيير اللوائح. كيف يمكن لمنصتنا معالجة كل هذه الأشياء على نطاق واسع؟

Ángel Agudo: يمكننا تقسيم هذا إلى أجزاء. واحد هو التشغيل. عندما نلتقط وجهات نظر مختلفة ، على سبيل المثال ، عندما نتحدث إلى العملاء ، قد نتلقى أجزاء من التعليقات القادمة من عملاء متعددين في نفس الوقت وحول نفس الموضوع. نحن نستخدم التكنولوجيا لمساعدتنا في تجميع كل شيء معا بأكثر الطرق كفاءة ، لتجميع المعلومات وتقييم وجهات النظر المختلفة لاتخاذ قرار في الوقت المناسب. من وجهة نظر العملية ، يتعلق الأمر بترجمة تلك التعليقات باستمرار إلى الأداة. لقد قمنا ببناء الأداة بطريقة تربط جميع القطع ، وتساعدنا التكنولوجيا على دمج التعليقات على الفور في كل مكان توجد فيه نقطة البيانات أو المقياس أو الشركة المحددة داخل النظام الأساسي.

كريس سيومبي: شكرا على الأفكار ، الجميع!

أدخل عنوان بريدك الإلكتروني لقراءة المزيد

طلب عرض توضيحي