مقدمة
يستخدم العديد من الناس يوميًا خدمات سيارات الأجرة حول العالم للتنقل في المناطق الحضرية ، فالبعض لا يمتلكون سيارات بينما لا يقود البعض الآخر سياراتهم عمدًا بسبب جدولهم المزدحم ، و تعد شركة أوبر Uber إحدى الشركات الرائدة عالميًا في هذا المجال ، لذا سنتناول في هذا الدرس التقني طريقة لتحليل رحلات هذه الشركة باستخدام لغة بايثون Python.
تحليل رحلات أوبر
من خلال تحليل رحلات أوبر ، يمكننا تصوير العديد من الأنماط ، مثل اليوم الذي يحتوي على أعلى وأقل الرحلات أو أكثر الساعات ازدحامًا لأوبر والعديد من الأنماط الأخرى ، و تستند مجموعة البيانات التي سنستخدمها هنا إلى رحلات أوبر في مدينة نيويورك ، وهي مدينة بها نظام نقل معقد للغاية مع مجتمع سكني كبير.
تحتوي مجموعة البيانات Dataset على بيانات لحوالي 4.5 مليون رحلة في مدينة نيويورك ضمن الفترة ما بين شهري آبريل و سبتمبر و 14.3 مليون رحلة مابين شهري يناير و يونيو لعامي 2014-2015. يمكنك فعل الكثير باستخدام هذه المجموعة من البيانات بدلاً من مجرد تحليلها ولكن لن نتطرق إلى ذلك في هذا الدرس و سنكتفي بمجموعة البيانات الخاصة بشهر سبتمبر فقط!.
مجموعة البيانات المستخدمة في الدرس : اضغط هنا للتحميل📂
المجموعة الكاملة : اضغط هنا للتحميل 🗃️
استدعاء المكتبات وسحب البيانات
نلاحظ أن البيانات تحتوي على المعلومات التالية:
- date/time : التاريخ/الوقت.
- Lat : إحداثيات خط العرض.
- Lon : إحداثيات خط الطول.
- Base : رقم الرحلة.
إنشاء ميزات إضافية مساعدة في عملية التحليل
الآن سنقوم بإنشاء ميزات إضافية لمساعدتنا في تحليل الرحلات بشكل أفضل وهي كالتالي :
- day : الأيام الشهرية من 01 – 31.
- weekday : أيام الأسبوع 0 – 6
- hour : الساعة وتمثل 24 وحدة.
الآن سأقوم باستدال القيم الرقمية Numerical Values لأيام الأسبوع إلى قيم فئوية Categorical Values من خلال أخذ أي تاريخ وليكن 09-09-2014 والبحث عنه في الانترنت وسنعلم من خلاله اليوم الموافق له في أيام الأسبوع وهو يوم الثلاثاء ويقابله في عمود weekday الرقم 1.
من خلال المعلومة السابقة بإمكاننا استنتاج الأيام في العامود weekday وتحويلها على الهيئة التالية :
تحليل رحلات أوبر في شهر سبتمبر لعام 2014
ما نلاحظه بالشكل أعلاه أن الرحلات ترتفع بشكل تدريجي من بداية الأسبوع حتى نهايته حيث أن عدد الرحلات في تاريخ 01-09-2014 هو 20000 رحلة والموافق ليوم الاثنين وهو بداية الأسبوع في نيويورك ويرتفع إلى أن يصل لأكثر من 40000 في نهاية الأسبوع.
الآن سنقوم بدراسة عدد الرحلات خلال أيام الأسبوع في شهر سبتمبر
نلاحظ من الشكل أعلاه ، أنه على مدى الشهر بأكمله الأيام الأكثر من حيث عدد الرحلات مرتبة ترتيبًا تنازليًا :
- الثلاثاء (الأكثر)
- السبت
- الجمعة
- الخميس
- الإثنين
- الأربعاء
- الأحد (الأقل)
يبدو أن الناس في نيويورك يفضلون الاستراحة في منازلهم يوم الأحد للاستعداد لأسبوع مليء بالأعمال 💼.
أما الآن سندرس ساعات الذروة والتي تمثل أكبر عدد من الطلبات على رحلات أوبر خلال اليوم
نلاحظ أن ساعات الذروة تمتد من الساعة 15:00 إلى 21:00 أي من الساعة 03:00 م إلى الساعة 9:00 م وأقصى ساعة ذروة في اليوم هي عند الساعة 18:00 أي الساعة 6:00 م.
نظرًا لأننا نمتلك بيانات حول خطوط الطول والعرض ، فيمكننا أيضًا رسم كثافة رحلات أوبر Uber وفقًا للمناطق الموجودة في مدينة نيويورك:
نلاحظ أن المنطقة الأكثر طلبًا لخدمات أوبر هي منتصف مدينة نيويورك والتي تعرف بالـ Midtown في مانهاتن والتي تقع بين خط طول73.99- و وخط عرض 40.75
ملخص التحليل
قد تناولنا في هذا الدرس التقني بعض الطرق التي يمكننا بها تحليل رحلات أوبر باستخدام لغة بايثون وهنا بعض الاستنتاجات التي حصلنا عليها :
- يوم الثلاثاء هو اليوم الأكثر ربحًا لشركة Uber في شهر سبتمبر.
- عدد الرحلات ترتفع بشكل تدريجي من بداية الأسبوع حتى نهايته.
- في أيام الأحد، يستخدم عدد أقل من الأشخاص خدمة أوبر.
- الساعة السادسة 6:00 مساءً هي ساعة الذروة القصوى لخدمة أوبر في مدينة نيويورك.
- تبدأ معظم رحلات أوبر بالقرب من منطقة مانهاتن في نيويورك.
انتهى الدرس ولكن لم تنتهِ رحلة التعلم لذا لا تترددوا في طرح تساؤلاتكم في قسم التعليقات أدناه.
درس ممتاز جدا..احسنت استاذ محمد
ممتاااز جدا ❤