غالبًا ما يُشار إلى عملية تصنيف الأشياء وتحديدها، وفهم العالم من خلال الصور التي تمّ جمعها من الكاميرات الرقمية بإسم “الرؤية الحاسوبية”. ورغم أنّ التجارب ضمن هذا المجال قد بدأت في خمسينيات القرن الماضي باستخدام أولى الشبكات العصبونية، إلّا أنه لا يزال أحد أكثر مجالات الذكاء الاصطناعي تعقيدًا، ويرجع ذلك جزئيًا إلى تعقيد العديد من المشاهد التي يتم التقاطها من العالم الحقيقي. وتعتمد الرؤية الحاسوبية على على مزيجٍ من علوم الهندسة والإحصاء والبصريات والتعلم الآلي وأحيانًا على الإضاءة وذلك لإنشاء محتوى رقمية من المنطقة التي تراها الكاميرا. في هذه المقالة سنعرض أين يجري استعمال الرؤية الحاسوبية وما هي أهم التطبيقات في هذا التقنية.
1. أين تستخدم تقنيات الرؤية الحاسوبية؟
◉ التعرّف على الوجوه
تستخدم تقنيات التعرف على الوجوه لمطابقة صورة وجه الشخص مع هويته، من خلال ميزات وجهه مقابل قاعدة بيانات للوجوه. ويمكن أن نجدها اليوم في الكثير من الأماكن؛ مثل تطبيقات التواصل الاجتماعي وكاميرات المراقبة وتقنيات المصادقة المعتمدة على العلامات الحيوية. وفي بعض الحالات، يمكن أن يوفر ذلك تحديدًا دقيقًا بما يكفي لتوفير الأمن، على الرغم مما تثيره هذه التقنية من انتقادات بشأن الخصوصية.
◉ التعرّف على الأشياء
يساعد العثور على الحدود بين الأجسام على تقسيم الصور والتصنيف وتوجيه الأتمتة. وفي بعض الأحيان تكون الخوارزميات قوية بما يكفي لتحديد الأشياء، أو الحيوانات، أو النباتات بدقة، وهي نقطة تشكل الأساس للتطبيقات في المصانع والمزارع وما إلى ذلك.
◉ التعرّف المنظم
عندما يكون الإعداد متوقعًا ويمكن تبسيطه بسهولة، وهو أمرٌ يحدث غالبًا على خطوط الانتاج أو المصانع، يمكن أن تكون الخوارزميات أكثر دقة. وهنا، توفّر خوارزميات الرؤية الحاسوبية طريقة جيدة لضمان مراقبة الجودة وتحسين السلامة، خاصة للمهام المتكررة.
◉ الإضاءة المنظمة
تَستخدم بعض الخوارزميات أنماطًا خاصةً من الإضاءة، غالبًا ما يتم إنشاؤها بواسطة الليزر، بغية تبسيط العمل وتقديم إجابات أكثر دقة مما يمكن إنشاؤه من مشهد مع إضاءةٍ منتشرة من عدة مصادر والتي غالبًا لا يمكن التنبؤ بها.
◉ التحليل الإحصائي
في بعض الحالات، يمكن أن تساعد الإحصاءات المتعلّقة بالمشهد في تتبّع أجسام الأشخاص. على سبيل المثال، يمكن لتتبع سرعة وطول خطوات الشخص من التعرّف عليه.
◉ تحليل وتلوين الصور
التحليل الدقيق للألوان في الصورة يمكن أن يجيب على الأسئلة. على سبيل المثال، يمكن قياس معدّل ضربات قلب الشخص عن طريق تتبُّع الموجة الأكثر احمرارًا مع كلّ نبضة، أو يمكن التعرّف على العديد من أنواع الطيور من خلال توزيع الألوان. بالإضافة إلى أن الرؤية الحاسوبية قد تتيح بتحويل صورة ذات تدرّج رماديّ إلى صورة كاملة الألوان.
2. أبرز تطبيقات الرؤية الحاسوبية
◉ التعرّف على الوجوه
توفّر العديد من مواقع الويب بغية تنظيم الصور بعض الآليات لفرز الصور حسب الأشخاص. وقد تتيح هذه الخاصية إمكانية العثور على الصور التي تحمل وجهًا محددًا. وتعدّ الخوارزميات دقيقة بما يكفي للقيام هذه المهمة، ويرجع ذلك جزئيًا إلى أن المستخدمين لا يحتاجون إلى دقةٍ تامة، وأنّ الصور المصنفة بشكلٍ خاطئ ليس لها سوى القليل من النتائج. ويجري الاستعانة بهذه التطبيقات في مجالات كالأمن، لكن هناك قلق من أنها قد لا تتمتّع بالدقة الكافية لدعم تحقيق العدالة على نحوٍ جدير. كما تستخدم في الصحة أيضًا كما هو الحال مع AiCure الذي يتعرّف على المرضى من خلال وجوههم، ويوزّع الأدوية الصحيحة ويراقبهم للتأكد من تناولهم الدواء.
◉ إعادة بناء أجسام ثلاثية الأبعاد
يُعدّ مسح الأجسام لإنشاء نماذج ثلاثية الأبعاد ممارسة شائعة للمصنعين ومصممي الألعاب. إن الرؤية ثلاثية الأبعاد عبارة عن رؤية ثنائية الأبعاد 2D (عرض x إرتفاع) يضاف إليها بُعدًا آخر هو العُمق. وعندما يتمّ التحكّم في الإضاءة، غالبًا باستخدام الليزر، تكون النتائج دقيقة بما يكفي لإعادة إنتاج العديد من الأشياء بدقة. ويقوم البعض بتغذية النموذج في طابعة ثلاثية الأبعاد، وأحيانًا مع بعض التحرير، وذلك لإنشاء استنساخ ثلاثي الأبعاد بشكل فعال. ومن الأمثلة على ذلك، شركة Saccade Vision التي تقوم بعمل مسح ضوئي ثلاثي الأبعاد للمنتجات للبحث عن العيوب.
◉ المركبات ذاتية القيادة
تحمل السيارات ذاتية التحكم طابعاً مستقبلياً، ولكنها بدأت تجوب الطرقات منذ الآن. وتعتمد هذه السيارات على الرؤية الحاسوبية لإدراك الوسط المحيط. حيث تتضمن المركبة عدداً من الكاميرات التي تلتقط مقاطع الفيديو من زوايا مختلفة، وترسل تلك المقاطع إلى نظام معالجة في الوقت الحقيقي لتحديد الأشياء؛ مثل علامات الطريق والأغراض المحيطة من مارة أو سيارات أخرى. لكن لا بدّ من الإشارة إلى أنها لا تزال غير قادرة على محاكاة تعقيدات القيادة في العالم الحقيقي. فهذه المركبات ذاتية القيادة لا تحتاج إلى اكتشاف البشر والأشياء الأخرى والتعرف عليها فحسب، بل يجب عليها التفاعل مع حركة البشر والسيارات الأخرى، أي التعامل مع بيانات متغيرة باستمرار.
◉ رسم الخرائط والنمذجة
يستخدم البعض صورًا من الطائرات والطائرات بدون طيار والسيارات لبناء نماذج دقيقة للطرق والمباني وأجزاء أخرى من العالم. تعتمد الدقة على كفاءة مستشعرات الكاميرا والإضاءة في يوم التقاطها. وعلى سبيل المثال تعدّ الخرائط الرقمية دقيقة بالفعل بما يكفي لهذا الغرض، ويتم تحسينها باستمرار، لكنها تتطلب في الغالب تحريرًا بشريًا للمشاهد المعقدة. وغالبًا ما تكون نماذج المباني دقيقة بما يكفي لبناء المباني وإعادة تشكيلها. فالأسقف على سبيل المثال غالبًا ما يقوم القائمون عليها بتقديم عروض للوظائف بناءً على قياسات من النماذج الرقمية المبنية تلقائيًا.
◉ التعرّف على الوجوه
تمكّن أنظمة الرؤية الحاسوبية الكاميرات وأجهزة الاستشعار الموجودة في المتاجر من تتبع المنتجات والأرفف والعملاء بدقة. وعادةً ما يستخدم أصحاب المتاجر ومشغلو المراكز التجارية خوارزميات الرؤية الآلية لتتبّع أنماط التسوق. ويقوم البعض بتجربة تحصيل الرسوم تلقائيًا من العملاء الذين يلتقطون عنصرًا ولا يعيدونه. ومن الأمثلة على ذلك نذكر Amazon Go الذي يتيح عمليات الشراء والدفع دون الانتظار في طوابير حيث يتم ذلك عن طريق الحساب البنكي بشكلٍ تلقائي وذلك بفضل نظام إلكتروني يعتمد على كاميرات المتجر وأجهزة الاستشعار التي تسمح بتحديد ما تم شراؤه.
الرؤية الحاسوبية في نمو هائل وتصاعد في مايخص استخدامها في تحليل قراءة البيانات، بدأت في وجهة نظري تعرف طريقها إلى “رؤية البشر” أنفسهم من حيث تقبل وفهم حقيقة الذكاء الاصطناعي بحكم انها جزء منه ..
مقالة جميلة تستحق القراءة والمشاركة .. شكراً لك
شكرا لك على المقالة ذات المحتوى القيّم
بارك الله فيكم على المحتوى القيم الذي تقدمونه خصوصا أنه قليل جدا باللغة العربية