أضواء كاشفة: جودة البيانات - البعد 2 ، النضارة

جودة البيانات 8 مايو 2023 أنخيل أجودو ، باتريشيا بينا ، خوان دييغو مارتن ، رون بوتوك ، كريس سيومبي

سلسلة مقابلات مع Clarity AI الفريق التنفيذي المعني بالأبعاد ال 8 لجودة البيانات

كيف Clarity AI تأكد من أن بياناتها من أعلى مستويات الجودة؟

Clarity AI يستخدم إطار عمل 8 أبعاد لضمان أن تكون البيانات من أعلى مستويات الجودة. هذه الأبعاد هي التغطية ، والنضارة / التوقيت ، والدقة ، وتحديثات البيانات ، وقابلية التفسير ، والاتساق ، والنقطة الزمنية ، والتعليقات. في هذه السلسلة من المقابلات مع Clarity AI المديرين التنفيذيين ، يتم استكشاف كل من هذه الأبعاد وشرحها. Clarity AIيقوم فريق الخبراء بإنشاء منهجيات علمية وقائمة على الأدلة تستفيد بعد ذلك من الذكاء الاصطناعي القوي والقابل للتطوير (مثل التعلم الآلي) لجمع مجموعات البيانات الحالية وتنظيفها وتحليلها وتوسيعها لتشغيل منصة تكنولوجيا الاستدامة الخاصة بها أو للاندماج مباشرة في سير العمل الحالي للمستخدمين.

البعد 2 – النضارة

Clarity AIنائب رئيس المنتج ، أنخيل أجودو ، رئيس أبحاث المنتجات والابتكار ، باتريشيا بينا ، رئيس استراتيجية البيانات ، خوان دييغو مارتن ، ورئيس علوم البيانات ، رون بوتوك ، يناقشون - مع كريس سيومبي ، Clarity AIالرئيس التنفيذي للتسويق - أهمية حداثة البيانات ، أو توقيت البيانات وأهميتها ، في قيادة عملية صنع القرار الدقيقة والمؤثرة. وسلطت المجموعة الضوء على تأثير حداثة البيانات على مختلف الصناعات وحالات الاستخدام. كما ناقشوا تحديات الحفاظ على حداثة البيانات ، مثل صوامع البيانات ، وقيود البنية التحتية للبيانات ، والديون التقنية.

وشدد المتحدثون على الحاجة إلى استراتيجية لإدارة البيانات تعطي الأولوية لحداثة البيانات، بما في ذلك الاستثمار في البنية التحتية للبيانات، ووضع سياسات واضحة لحوكمة البيانات، ودمج التعلم الآلي وتقنيات الذكاء الاصطناعي لأتمتة معالجة البيانات وضمان دقة البيانات. كما تبادل المشاركون رؤى حول الأبعاد المختلفة لحداثة البيانات، بما في ذلك تغطية البيانات وتكرارها وزمن وصولها، وناقشوا استراتيجيات لتحسين كل بعد. وبشكل عام، شددت اللجنة على الدور الحاسم لحداثة البيانات في تمكين المؤسسات من اتخاذ قرارات مستنيرة وإحداث تأثير إيجابي، وشددت على الحاجة إلى الاستثمار المستمر في إدارة البيانات والتكنولوجيا لضمان الحفاظ على حداثة البيانات بمرور الوقت كعنصر حاسم في جودة البيانات.

كريس سيومبي: مرحبا مرة أخرى ، الجميع. سنركز هذه المرة على الحداثة وكيفية ارتباطها بجودة البيانات. Ángel ، هل يمكنك البدء بتعريف النضارة من حيث صلتها بجودة البيانات؟

Ángel Agudo: واثق. إليّ النضارة تعني الحصول على أحدث البيانات وأكثرها وضوحا في Clarity AI. يجب تحديد اتفاقية مستوى الخدمة المحددة (SLA) للنضارة من قبل السوق ، ولكن يجب أن تكون في أقرب وقت ممكن ، حتى نتمكن من تقديم المعلومات ذات الصلة وفي الوقت المناسب للمستخدمين.

باتريشيا بينا: أتفق مع أنجيل. في عملية صنع القرار ، يعد الوصول إلى أحدث المعلومات أمرا بالغ الأهمية ، خاصة في عالم تتغير فيه الأشياء باستمرار. مع بيانات الاستدامة ، على سبيل المثال ، يحدث تغير المناخ بسرعة ، والوقت ينفد. لذلك ، نضارة ضرورية. بالإضافة إلى ذلك ، تلتزم الشركات بتقليل الانبعاثات ، ومن الأهمية بمكان تتبع تقدمها ومحاسبتها على وعودها. لذا ، فإن الحصول على بيانات سريعة وجديدة حول أدائهم أمر بالغ الأهمية لضمان متابعتهم لالتزاماتهم.

كريس سيومبي: خوان دييغو ، هل يمكنك توضيح المزيد حول كيفية Clarity AI يضمن حداثة البيانات التي يوفرها؟

خوان دييغو مارتين: التاكيد. لقد قمنا بتبسيط العمليات لضمان حداثة البيانات. أولا ، نراقب باستمرار متى تقوم الشركات بتحديث معلوماتها العامة والإبلاغ عنها. ثانيا ، نقوم باستخراج المعلومات ومعالجتها باستخدام مزيج من التكنولوجيا والخبراء. نطبق أيضا ضوابط الجودة في نفس الحلقة لمنع معالجة أي بيانات مشبوهة. ثالثا ، لدينا خط أنابيب بيانات الابتلاع التلقائي الذي يمكننا من إتاحة المعلومات لعملائنا من خلال وسائلهم المفضلة ، مثل واجهة برمجة تطبيقات خلاصات البيانات. بالإضافة إلى ذلك ، نقدم محطة خدمة لعملائنا مع تحديثات متكررة للغاية ، مع التحديثات الأكثر شيوعا عند اكتشاف جدل جديد. نقوم بمعالجة معلومات الجدل المنظمة وغير المنظمة من أكثر من 1.4 مليون مقالة إخبارية من أكثر من 33000 مصدر إخباري موثوق به يوميا.

كريس سيومبي: شكرا على الشرح ، خوان دييغو. أود أن أركز على النقطة الثانية التي ذكرتها سابقا ، حول المزيج الصحيح من التكنولوجيا والخبراء. هل يمكنك تقديم مزيد من التفاصيل حول هذا؟

خوان دييغو مارتين: بالتأكيد. بينما نستخدم الذكاء الاصطناعي لأتمتة معظم العمل ، مثل اكتشاف المعلومات الصحيحة واستخراجها ، هناك حالات تنتشر فيها المعلومات في جميع أنحاء التقرير. على سبيل المثال ، قد يتم تضمين بيانات الموظفين في شركات تابعة مختلفة ، وقد يتم الكشف عن الانبعاثات لكل خط عمل في أقسام مختلفة. في مثل هذه الحالات ، نحتاج إلى خبراء لفهم المعلومات المستخرجة تلقائيا والتأكد من أن البيانات المجمعة دقيقة وتعكس ما يتوقعه عملاؤنا.

كريس سيومبي: شكرًا لك. رون ، كيف يؤثر الذكاء الاصطناعي على حداثة البيانات في Clarity AI?

رون بوتوك: حسنا ، كما ذكر خوان دييغو سابقا ، يمكن لأجهزة الكمبيوتر القراءة والرؤية بشكل جيد إلى حد ما في الوقت الحاضر. يمكننا الاستفادة من هذه التقنيات لمساعدتنا في جمع البيانات بسرعة وكفاءة. ومع ذلك ، فإننا نقدم البيانات المالية لاتخاذ القرارات المالية ، مما يعني أن البيانات يجب أن تكون دقيقة للغاية. لا يمكن للنماذج الإحصائية أبدا تحقيق دقة بنسبة 100٪ ، لذا فإن الجمع بين أجهزة الكمبيوتر والأشخاص ضروري لضمان الكفاءة والدقة. نحن بحاجة إلى كليهما لضمان وصول البيانات السريعة وعالية الجودة إلى عملائنا.

كريس سيومبي: هذا يحمل معنى. هل لديك أي حالات مثيرة للاهتمام لمشاركتها حول كيفية Clarity AI يستخدم تقنيات التعلم الآلي في استخراج البيانات؟

رون بوتوك: نعم ، لدينا حالة أخرى تتعلق بنماذج التقدير الخاصة بنا. بالنسبة للشركات التي لا تبلغ عن معلومات الاستدامة الخاصة بها، لا يمكننا استخدام الذكاء الاصطناعي لاستخراج بياناتها. ومع ذلك ، يمكننا الحصول على المعلومات المالية بسرعة كبيرة لكل سنة مالية لأن الشركات سريعة بشكل عام في الكشف عن هذه المعلومات. يمكننا تقدير الانبعاثات لهذه الشركات بسرعة ، لكننا اخترنا عدم القيام بذلك. ننتظر أن تبدأ الشركات في الكشف عن بيانات الاستدامة الخاصة بها أولا ، حتى نتمكن من ضمان معايرة نماذجنا بشكل صحيح كل عام جديد من البيانات الواردة. ننتظر الإبلاغ عن البيانات المبلغ عنها حديثا قبل أن نطرح تقديراتنا الجديدة للتأكد من أن العالم لم يتغير ، وأن نموذج التقدير يحتاج إلى مراجعة. لدينا مراقبة جودة إضافية كل عام.

كريس سيومبي: هذا مثير للاهتمام. لذا ، فإن سبب الانتظار هو أن النماذج تتعلم من التاريخ ، وإذا لم يعد الماضي يمثل اليوم ، فعلينا أن نأخذ ذلك في الاعتبار؟

رون بوتوك: بالضبط. تتعلم النماذج من التاريخ ، وإذا لم يعد الماضي مؤشرا مثاليا للمستقبل ، فنحن بحاجة إلى تعديل نماذجنا باستمرار للتنبؤ باليوم بدقة. نحن نتوقع ابتكارات حول المكونات البيئية ، لذلك نتوقع أن يتغير العالم بمرور الوقت ، ولن يكون الماضي دائما مؤشرا مثاليا للمستقبل. نحن بحاجة إلى تعديل نماذجنا باستمرار ونحن نمضي قدما للتأكد من أنها تتنبأ اليوم بدقة.

كريس سيومبي: عظيم. هل يمكن للنماذج التعلم وتكييف نفسها بمرور الوقت؟

رون بوتوك: نعم ، يمكن للنماذج التعرف على الميزات التي تقود التغييرات. يمكننا أن نجعل النموذج ذكيا بما يكفي لفهم التغييرات التي نعلم أنها قادمة. يمكننا ترك مساحة للتكنولوجيات الجديدة ، وتطبيق الذكاء الاصطناعي لجعل الأمور أكثر كفاءة. يمكننا التنبؤ بالميزات التطلعية بطبيعتها. على سبيل المثال، إذا قالت دولة ما إنها ستتخلص تدريجيا من محطات الفحم في غضون ثلاث سنوات، فيمكننا إضافة هذه المعلومات إلى نماذجنا لمعرفة ما سيحدث في غضون ثلاث سنوات.

كريس سيومبي: المنطقي. شكرا رون. باتريشيا ، كيف تساعد حداثة البيانات في دفع ابتكار المنتجات في Clarity AI?

باتريشيا بينا: في Clarity AI، فإننا نسعى جاهدين لإيجاد مصادر بديلة للبيانات ذات الصلة التي تتوفر في وقت أبكر من البيانات التي تنشرها الشركات مرة واحدة في السنة، عادة بعد بضعة أشهر من انتهاء فترة التقرير المقابلة. على سبيل المثال ، نستخدم بيانات الأقمار الصناعية في الوقت الفعلي لاستنتاج مقدار الشركات التي تنبعث منها ، بدلا من الانتظار لمدة عام ونصف العام لمعرفة ما حدث اليوم. يتيح لنا ذلك توفير بيانات أحدث لمستخدمينا.

كريس سيومبي: كيف حداثة البيانات في Clarity AI التأثير على قدرات منصة التكنولوجيا؟

Ángel Agudo: تعد حداثة البيانات أمرا بالغ الأهمية لمستخدمينا لاتخاذ قرارات مستنيرة. إنها تمكننا من إظهار أنه تم تضمين أحدث المعلومات ، وهو أمر مهم لقابلية التفسير. هدفنا هو أن نكون فعالين قدر الإمكان في نشر البيانات وإتاحتها للمستخدمين. بينما نلتقط البيانات ونقوم بتحديثها بشكل أسرع ، يمكننا أن نظهر للمستخدمين مدى سرعة توفر المعلومات الجديدة ومساعدتهم على أن يكونوا أكثر استباقية في عملية صنع القرار.

خوان دييغو مارتين: تتيح لنا قدرتنا على اكتشاف وقت نشر معلومات جديدة كل عام التنبؤ بموعد توفر المعلومات وتبسيط عملياتنا لتحديثها. هذا أمر مهم لعملائنا لأنه يمكنهم التخطيط عندما تكون المعلومات التي يحتاجون إليها متاحة في منتجاتنا.

Ángel Agudo: جميع الأبعاد التي ذكرناها ، مثل دقة البيانات واكتمالها وتوقيتها ، ضرورية لمستخدمينا لاتخاذ قرارات مستنيرة. في حين أنه قد يكون من الصعب تحقيقه ، إلا أننا نبتكر ونقدم قيمة لأن هذه الأبعاد مهمة لصنع القرار. بدون البيانات الصحيحة أو مع وجود أخطاء في البيانات ، قد لا يتخذ المستخدمون القرارات الصحيحة.

كريس سيومبي: هذا منطقي بالطبع ، ولكن دعنا نعيده إلى بعد النضارة من حيث صلته بجودة البيانات في الوقت الحالي. أي شيء آخر يختتم لنا؟

باتريشيا بينا: النقطة الأخيرة التي أردت توضيحها هي أن بعض العملاء اضطروا إلى استثمار موارد كبيرة وجهد ووقت مع مزودي بيانات الاستدامة لتنظيف البيانات وضمان حداثتها ، للتأكد من أنهم يشترون البيانات المناسبة لتناسب احتياجاتهم. بينما نحن ، نضمن بشكل استباقي أن عملائنا لا يحتاجون إلى المرور بعمليات مكلفة وغير ضرورية.

كريس سيومبي: شكرا للجميع!

أدخل عنوان بريدك الإلكتروني لقراءة المزيد