كيف يتمكن الحاسوب من رؤية الأجسام؟ – الرؤية الحاسوبية

الأثنين 20 ذو الحجة 1441ھ الأثنين 10 أغسطس 2020م
فيسبوك
إكس
واتساب
تيليجرام
لينكدإن

785 كلمة

9 دقائق

المحتوى

مكن الله البشر من رؤية الأجسام من حولهم والتعرف عليها عن طريق حاسة البصر والإدراك العقلي، عمليات معقدة وكثيرة تتم في أجزاء لا تذكر من الوقت، ولأن أجهزة الحاسوب لا تمتلك هذه القدرات، قام البشر بمجهودات كبيرة بدأت منذ حوالي ٦ عقود في مجال يعرف بالرؤية الحاسوبية (Computer Vision)، سخروا فيه طاقات بحثية وتطبيقية كثيرة لتطوير قدرة الحاسوب على التعرف على الأجسام في الصور والفيديو.

ما هي الرؤية الحاسوبية؟

الرؤية الحاسوبية هي أحد أشهر مجالات الذكاء الاصطناعي، يتم من خلاله تدريب الحاسوب ليقوم بتمييز الأشياء بصريًا، حيث تستخدم الصور ومقاطع الفيديو لتدريب نماذج التعلم العميق التي ستعمل بعدها على التعرف على أجسام جديدة في صور ومقاطع فيديو لم يسبق لها مشاهدتها، وهكذا يصبح الحاسوب يعمل وكأنه يرى الأجسام من حوله.

في الأسفل -يسارًا- مثالٌ لصورة لرقم 8 كما نراها نحن على الحاسوب إن قمنا بتكبيرها، ونلاحظ أنها مكونة من عدد كبير من المربعات Pixels، وعلى اليمين ذات الصورة كما يراها الحاسوب، حيث يراها كمصفوفة أرقام، كل رقم يمثل قيمة لمربع من المربعات، وهو يحمل قيمة الضوء intensity لهذا المربع وعليه يحدد لون هذا المربع ومقدار سطوعه.

kNP3LPljzr HuB3to lqcuzgwi0tvXwT3sqjcFsoJxCJ1Nh3wghUCwggTjI3BvFuxgVbk455XcgbKlsjB EUQ85A2Q
SbcgGvXCsxlfpEP1tFiNIOAys2EMxnAlScHkndMWLgiDDZHrYjyFS67nYRqLM32ETMZ9rX7WHWu boXP34r3uQcXx8skeLU0OWc9UoHvljw8MTGZRinveH C6 Vuo 2fGcyIRKN6

مراحل عمل الرؤية الحاسوبية؟

تختلف آلية عمل أنظمة الرؤية الحاسوبية باختلاف مجال تطبيقها وعوامل أخرى، وعمومًا، تشترك في معظم الخطوات الآتية:

1- تكوين الصور

يتم تكوين وجمع الصور في أول مرحلة من مراحل بناء أي نظام يعمل بالرؤية الحاسوبية، ويستخدم في هذا الكاميرات لجمع الصور ومقاطع الفيديو بمختلف أنواعها كالصور ثنائية الأبعاد وثلاثية الأبعاد والملونة والأحادية وغيرها، وتستخدم أجهزة أخرى غير الكاميرات كأجهزة التصوير المقطعي والرادارات.

تعمل أجهزة التصوير في هذه المرحلة عمل الحساسات، التي يطلب منها التقاط الضوء والعمق وغيره، ليتم لاحقًا العمل على هذه الالتقاطات لفهمها وتفسير ما تحتويه، وعند الرجوع للنموذج الأساسي وهو الإبصار عند الإنسان، نجد أن هذه الأجهزة تحاكي عمل العين البشرية، والتي بدورها تلتقط صورًا واشاراتٍ تنقلها للدماغ لتفسيرها والتعرف على ما تحتويه.

N72dxwi1VdEr3tIohmDReOUpE P5ky7QCSJ906tKeEl bTmxsx6BFYwX6xGrfjewtcai9V2J308YW z8zG0k cjJKFBWhjvmRKBPSJda bW84pOC6Q7o rdKzNXGoORZHf7pu6uO
آلية تكوين الكاميرا للصور لجسم ما في ظل توفر مصدر للطاقة

2- المعالجة المسبقة

لابد من تجهيز الصور قبل استخراج أي معلومات منها عن طريق أنواع من المعالجة بهدف التأكد من أن الصور تتبع الفرضيات التي نضعها وملائمة للمرحلة التالية، وكلما كانت الصور ذا جودة عالية ومطابقة للفرضيات، كلما ساعد ذلك في استخراج معلومات أكثر دقة، ومن أمثلة عمليات المعالجة هذه تحسين مستوى السطوع، وتقليل التشويش، وتغيير مقاس الصورة، وتدوير الصورة عموديًا أو أفقيًا، وتحويل الصور من صور ملونة بنظام RBG/RGB إلى صور أحادية Grayscale، وغيرها من العمليات.

7BSyQJDjvDYIPXTeo2i54zkwhP02R7Md77TGH4maP94KabqhadpADmNnRxXnGgJHLsIsblbl2JgbRg9vcLarv33sOziOLaMq7NOx6o oN5CWICGwsk 2h3dTBqtapOtAdwgG u4i
أمثلة على عمليات المعالجة المسبقة

3- استخراج الخصائص

عندما نقول مجازًا أن الحاسوب يرى، فهو بالطبع لا يرى ألوان الصورة وما تحتويه من أجسام أو نصوص وغيرها، بل يرى مصفوفات من الأرقام كما تحدثنا سابقًا، يتعامل الحاسوب مع هذه الأرقام ليتعرف لاحقًا على خصائص مهمة، وتتحدد أهمية الخاصية بحسب المشكلة التي يعمل النظام على حلها، كالخطوط والأطراف وغيرها.

x m9hOLvZ8INKFUPfO1A9LoKgAsu 8Lnn1 5kWx2uoi Lwam9aRrkh4EwPGb69tGdSBF4p2XZ73PKoszMmM91BE4 irVaEanCjkyMdBT
تحديد الأطراف لصورة عملات معدنية

4- تجزئة الصور وتحديد الأجسام

بعد استخراج الخصائص من الصور، يمكن عندها تحديد الأجزاء المهمة في الصورة والتي تعتمد على المشكلة التي يحلها النظام، مثلًا، النظام الذي يُعنى بقراءة الشفاه لمعرفة الكلام المنطوق سيهتم بتجزئة منطقة الفم وما حولها، ونظام يقوم بعد العملات المعدنية في الصور وتحديد فئاتها سيهتم بتحديد كل عملة وتحديد التفاصيل داخل العملة، وهكذا، في الصورة أسفل، يهتم بالنظام بتحديد منطقة الفم للقطة وعليها يستطيع تمييز أنها قطة وليست كلبًا أو كأسًا أو قبعة.

g2ylVjAKXbqgFGuVnmviOePl6l1s4XV2rkZQqSgXx

5- المعالجة عالية المستوى واتخاذ القرارات

بعد أن يصبح لدى الحاسوب المعلومات الكافية، حيث قام باستخراجها من الصور، وبحسب ما لديه من معرفة سابقة، سيحدد مالذي تحتويه الصورة وما القرار المقابل لهذا، مثلًا، في نظام يقوم بتصنيف الصور إلى واحد من ٤ أجسام، قطة أو كلب أو قبعة أو كأس (كما في الصورة السابقة)، سيحدد بنسب متفاوتة قراره تجاه كل تصنيف، ولاتخاذ القرار، سيقوم النظام بترجيح التصنيف ذي النسبة الأعلى ليكون هو التصنيف الذي يعتمده لهذه الصورة، وفي نظام في مصنع يقوم بتحديد إذا ما كانت القطع سليمة أو معطوبة، سيعطي قرارًا إما بالحكم على القطعة بأنها سليمة فتبقى، أو معطوبة فيتم استبعادها.

تطبيقات للرؤية الحاسوبية

للرؤية الحاسوبية تطبيقات كثيرة من حولنا، يتميز مجال الرؤية الحاسوبية بتطبيقات شيقة وملفتة، حيث يقوم فيها الحاسوب بأداء مبهر، ومن الأمثلة على هذه التطبيقات:

  • أنظمة التعرف على الأحرف (OCR-based systems) والتي تستطيع استخراج النصوص من الصور.
  • الأنظمة المساعدة في قطاع التجزئة لتحديد كميات البضائع على الأرفف وأنظمة الخدمة الذاتية للدفع.
  • أنظمة المراقبة والأنظمة المساعدة في إدارة الحشود.
  • أنظمة السيارات ذاتية القيادة والتي تستطيع تمييز الأشخاص وعلامات الطريق وغيرها.
  • الأنظمة الطبية المساعدة لاكتشاف الأمراض عن طريق الصور أو التصوير الاشعاعي.
  • أنظمة تحديد مخالفة استعمال الهاتف المحمول أثناء القيادة، ورصد لوحات السيارات المخالفة.

مع انتشار الكاميرات وأجهزة الهاتف المحمول وتوفر البيانات البصرية، حيث وبحسب الاحصاءات فإن المستخدمين على الانترنت يقومون بمشاركة ٣ مليار صورة يوميًا، ومع تطور القدرات الحاسوبية لاستيعاب متطلبات التعلم العميق، أصبح المجال أوسع وأسهل لتطبيق الرؤية الحاسوبية في مجالات عديدة، ولتطوير أداء الأنظمة التي تعمل في هذا المجال، ولا تنحصر تطبيقات الرؤية الحاسوبية في الأمثلة والمجالات المذكورة، بل تمتد لمجالات أخرى، ولا يزال المجال ينمو ويتطور.

المصادر:

نشرة فهم البريدية
لتبقى على اطلاع دائم على كل ما هو جديد مما تقدمه منصة فهم، انضم لنشرتنا البريدية.
حاصلة على بكالوريوس علوم الحاسبات من جامعة الملك عبدالعزيز - مسار الأنظمة الذكية، مهتمة بالذكاء الاصطناعي، وعلم البيانات، والرؤية الحاسوبية، عملت في مجال التعرف على الكلام بالاعتماد على الصور المرئية، مهتمة بنشر أبحاث الذكاء الاصطناعي والتدوين ونشر المحتوى العربي عبر الإنترنت.

اترك تعليقاً

لن يتم نشر عنوان بريدك الإلكتروني. الحقول الإلزامية مشار إليها بـ *