ماذا يعني وجود البيانات المصطنعة للذكاء الاصطناعي في الرعاية الصحية؟

الأحد 08 جمادى الأولى 1443ھ الأحد 12 ديسمبر 2021م
فيسبوك
إكس
واتساب
تيليجرام
لينكدإن

887 كلمة

8 دقائق

المحتوى
3738A
المصدر:Nature

تشكّل البيانات شريان الحياة بالنسبة للذكاء الاصطناعي. ومع تنامي أهميّة هذه التقنية في مجال الطبّ، تبرز الحاجة الماسّة للبيانات بالإضافة إلى إعدادها (Data Annotation) والذي يعتبر أحد أهم جوانب العمل في بناء الخوارزمية. وفي مجال الرعاية الصحية، فإنّ جمع البيانات يعني استخدام قواعد البيانات القائمة، والصور، ونتائج الأشعة، والعيّنات، والمسح المقطعي، والتصوير بالرنين المغناطيسي، وسجلّات المرضى وغير ذلك. وكلّما زادت البيانات التي تغذّي النظام، كلّما كانت النتائج أفضل. وقد اكتسب الذكاء الاصطناعي مكانته في العديد من مجالات الطب، من التعرّف على الأنماط، ودعم التشخيص، وإنشاء مسارات العلاج، إلى تحسين الخدمات اللوجستية للرعاية الصحية. فالخوارزميات الذكية يمكن لها أن تغربل كمياتٍ كبيرة من البيانات التي لا يستطيع البشر أن يحلّلها ويستخلص منها اتجاهاتٍ ونتائج واضحة. ويمكن أن تتضمّن البيانات المتعلقة بالصحة الخاصة بنا الكثير من الأشكال: من السجلّات الطبية الإلكترونية، إلى التقارير الجينية، مرورًا بالبيانات المتأتّية من الساعات الذكية والأجهزة القابلة للارتداء وما إلى ذلك. وهذه، كلها وسائل لتغذية الذكاء الاصطناعي في مجموعات البيانات الصحية. ولكن ماذا لو لم نتمكّن من الحصول على بياناتٍ كافية للمساهمة في تقدّم الذكاء الاصطناعي بمجال الرعاية الصحية؟ وماذا لو كانت مخاوف الخصوصية لا تسمح للمستشفيات بمشاركة السجلّات الطبية مع الشركات؟

هنا يأتي دور البيانات المصطنعة والتي ستكون محور هذا المقال.

1- هل البيانات المصطنعة فعلًا حقيقية؟

لا نستطيع أن نقول أنّها حقيقية إلّا أنها مبنية على بياناتٍ مستمدة من الواقع. وهناك طرق تضمن تشابه البيانات المصطنعة إلى حدّ كبير مع البيانات الحقيقية، من بينها شبكة الخصومة التوليدية (GAN) وهي  عبارة عن نموذجين من الشبكات العصبونية الاصطناعية: شبكة توليدية وشبكة تمييزية، تلقّم هاتين الشبكتين بمجموعات من البيانات، وتتولى الشبكة التوليدية إنتاج مخرجاتٍ اصطناعية كالصور مثلًا، فيما تعمل الشبكة التمييزية على مقارنتها مع الصور الحقيقية من البيانات الأصلية، وعليه تضبط الشبكة التوليدية معلماتها لإنشاء صورٍ جديدة.

ولتقريب الصورة أكثر، دعونا نتخيل أنّ هناك رسامًا يريد إنشاء نسخٍ أفضل من لوحات الرسام “ليوناردو دا فينشي” مثلُا لبيعها على أنّها حقيقية. وعلى الجانب الآخر، هناك محقّق يريد الإمساك به من خلال اكتشاف اللوحات المقلَّدة. ويتطوّر أداء الرسام بشكلٍ أفضل في إنشاء اللوحات تلك من خلال رسم المزيد من هذه اللوحات. وفي الوقت نفسه، نرى أنّ المحقّق يزداد مهارةً في التعرُّف على تلك الأعمال الفنية التي هي نسخ طبق الأصل. وبعد العديد من التكرارات، نجد أنّ الرسّام استطاع رسم لوحاتٍ لا يمكن تمييزها عن لوحات دافينشي الحقيقية. وبهذه الطريقة يستطيع الذكاء الاصطناعي إنشاء صورٍ اصطناعية للمعلمات بغية تطوير الخوارزمية لتكون قادرة مثلًا على اكتشاف سرطان الجلد أو مشاكل الجلد الأخرى وما إلى ذلك. واستنادًا إلى البيانات الموجودة، تحاول الخوارزمية إنشاء بيانات تختلف نوعًا ما عن البيانات الأصلية، ولكن ليس لأن تؤدّي إلى نتيجةٍ خاطئة. لذلك فهي ليست حقيقية -لكن في الوقت نفسه ليست زائفة-.

2- أهمية البيانات في الرعاية الصحية

ولتقريب الصورة أكثر، دعونا نتخيل أنّ هناك رسامًا يريد إنشاء نسخٍ أفضل من لوحات الرسام “ليوناردو إنّ أكبر عقبةٍ أمام الذكاء الاصطناعي هي في عدم كفاية البيانات المتاحة. وبدون بيانات المرضى، لا يوجد ذكاء اصطناعي في الرعاية الصحية. وعليه، فمن جهة هناك حاجة إلى كميةٍ هائلة من البيانات لتغذية الخوارزميات. ومن جهةٍ أخرى، تحتاج البيانات إلى إعداد وشرح، كرسم خطوطٍ حول الأورام لتحديد الخلايا بدقة أو ما شابه ذلك.

وقبل كلّ شيء، فإنّ المخاوف المتعلّقة الخصوصية تحدّ من كمية البيانات المتاحة في الطب. فالعمل مع بيانات المرضى الحساسة تعدّ مسألةً صعبة. وقد رأينا في العديد من الحالات كيف يمكن تسريب المعلومات الحساسة ولو بشكلٍ غير مقصود. ونحن لا نتحدّث حتى عن القرصنة أو الخصوصية، بل مجرد قاعدة بيانات غير محمية كما ينبغي. وقد تتيح الأساليب الجديدة مثل التعلّم الموحّد أو التعاوني (Federated Learning) بناء نماذج من دون مشاركة بيانات المستخدمين، وهو أحد تقنيات التعلم الآلي، وفيه يتم تدريب الخوارزميات على بياناتٍ محلية، من دون إرسال هذه البيانات إلى المخدِّم أو تبادلها بين الأجهزة المختلفة، إلّا أن نطاقه يبقى محدودًا. وهنا يمكن أن تكون البيانات المصطنعة مفيدة، حيث يمكنها ملء البيانات الناقصة، مما يجعل من الممكن إنتاج مجموعاتٍ بيانات للمرضى اصطناعيًا، وتكون كافية لتدريب الذكاء الاصطناعي مثل بيانات العالم الحقيقي، مع الحفاظ على خصوصية بيانات المرضى وحمايتها. وباستخدام مجموعات البيانات المدرَّبة هذه، يمكن إبطال التحيّز الحالي في برمجة الذكاء الاصطناعي. خصوصًا مع الإشكاليات المستمرّة بسبب محدودية الوصول إلى البيانات التي تركّز على العرق، واللون وغيرها من الأمور. وهذا ما وجدته دراسة لمختبر آم آي تي في أنّ أنظمة التعرف على الوجه من شركات مثل “آي بي إم” و “مايكروسوفت” كانت أكثر دقّة على الأفراد ذوي البشرة الفاتحة بنسبة تراوحت بين 11 و19%. وعليه يمكن أن تساعد البيانات المصطنعة في التغلّب على هذا التحدي، حيث يمكن أن يركّز التدريب على مثل هذه المتغيّرات، مع الاستفادة من بيئات العالم الحقيقي.

3- استخدام عملي

للبيانات المصطنعة عدد من حالات الاستخدام العملي، فقد طورت مجموعة من الباحثين نموذج رؤية حاسوبي للمساعدة في تحسين دعم قرار أخصائي علم الأمراض لتشخيص أورام الدماغ بشكلٍ أكثر دقة. وكان التحدي الذي يواجهونه هو أنهم إذا أرادوا استخدام عمليات مسح الدماغ من مؤسساتٍ أخرى، فإنّ كفاءة الخوارزمية تنخفض لأنّها لا تستطيع مقارنة الأنواع المختلفة من عمليات المسح. لكن ومن خلال استخدام البيانات المصطنعة المدربة على مجموعات بيانات أكبر بكثير، كانت الخوارزميات أكثر قدرة على تعلّم ما يمكن البحث عنه في صور علم الأمراض.

قد لا تكون البيانات المصطنعة هي الحلّ لجميع المشكلات التي تطرحها برمجة الذكاء الاصطناعي في الرعاية الصحية. بل حتى أنّ البعض  يرى أنها لا يمكن أن تضيف شيئًا جديدًا إلى قضايا الخصوصية المثارة. ومع ذلك، لا تزال هذه التجارب في مراحلها الأولى، قبل أن يصبح نهج البيانات المصطنعة جاهزًا لتوليد بيانات يمكن استخدامها على نحوٍ مسؤول في تدريب الخوارزميات وإيقاع آثار حقيقية في تحيّزات تعلم الآلة خصوصًا فيما يخصّ البيانات الطبية.

نشرة فهم البريدية
لتبقى على اطلاع دائم على كل ما هو جديد مما تقدمه منصة فهم، انضم لنشرتنا البريدية.
باحث في مجال الذكاء الاصطناعي. كاتب تقني. يرتكز عمله المهني على توفير المهارات الإستراتيجية لدعم وفهم تقنية الذكاء الاصطناعي في المنطقة العربية. أنجز العديد من الدراسات والمقالات العلمية في الذكاء الاصطناعي، وتركّز أبحاثه على التأثير الحقيقي لهذه التقنية في مختلف المجالات.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *