مقدمة Introduction :
سنتطرق في هذا الدرس إلى مفهوم تصميم ونمذجة البيانات ومستوياته المختلفة والذي يعد أحد مجالات الاختصاص المرتبطة بإدارة البيانات بالإضافة إلى شرح العمليات الأساسية في النمذجة والفوائد المحققة بواسطة هذه العمليات.
نمذجة البيانات | Data Modeling :
نمذجة البيانات Data Modeling: هي عملية اكتشاف متطلبات البيانات وتحليلها وتحديد نطاقها ، لإنشاء تمثيل بصري Visual Representation يعبر عن متطلبات البيانات من حيث نقاط اتصالها وهيكلتها في شكل دقيق يسمى نموذج البيانات Data Model. هذه العملية تكرارية وقابلة للتحديث وقد تتضمن، النموذج المفاهيمي ،المنطقي والمادي لمتطلبات البيانات.
جدير بالذكر أنه يوجد عدة نماذج للبيانات (Relational, Dimensional, Object-Oriented, Fact-Based, Time-Based, and NoSQL) سنكتفي في هذا الدرس بالتمثيل عن النموذج العلائقي Relational وهو الأكثر شهرة.
الغرض من تمثيل نموذج البيانات توضيح كل مايلي:
- أنواع البيانات Data Types وطريقة تخزينها في النظام.
- العلاقة بين أنواع هذه البيانات.
- طريقة جمع وتنظيم البيانات.
- صيغة البيانات وسماتها Data Format and its attributes.
ولكن مالفرق بين نمذجة البيانات ومعمارية أو بُنية البيانات التي تم شرحها في الدرس السابق ؟
نمذجة البيانات Data Modeling | بُنية البيانات Data Architecture |
نموذج يمثل البيانات في الواقع | إطار عمل من الأنظمة و التقنيات اللوجستية |
تعمل على تمثيل البيانات في الواقع | تركز على الأدوات والمنصات المسؤولة عن تخزين ومعالجة البيانات |
تركز على دقة وضبط البيانات | تحدد البنية التحتية المناسبة لاستضافة البيانات |
تركز على زيادة اعتماد و موثوقية البيانات | تركز على إبقاء البيانات آمنة |
تمثل عدد محدد من مفاهيم الأعمال التجارية | تغطي بنية متكاملة للبيانات في كل المؤسسة |
المستويات الثلاثة لنمذجة البيانات :
1- نموذج البيانات المفاهيمي Conceptual Data Model:
هو النموذج الأبسط ويركز على كيف ستبدو البيانات في النظام حيث يقوم معماري البيانات أو منمذج البيانات بتصميم هذا النموذج بناء على مدخلات الأعمال التجارية Business Input و أصحاب المصلحة stakeholders والغرض من النموذج المفاهيمي هو تنظيم وتعريف مفاهيم الأعمال التجارية والذي يعكس الصورة العامة للبيانات وكيف ستبدأ النمذجة المادية الفعلية للبيانات.
2- نموذج البيانات المنطقي Logical Data Model:
يُّعرف كيف سيتم تنفيذ النظام بغض النظر عن نظام إدارة البيانات المستخدم ويتم من خلال قيام معماري البيانات أو منمذج البيانات بتصميمه بناء على نقاشات و مدخلات محللي البيانات Data Analysts و أصحاب المصلحة المرتبطين بالأعمال التجارية في المؤسسة والغرض من هذا النموذج هو تزويدنا بخارطة تقنية لتنفيذ نموذج البيانات المادي.
3- نموذح البيانات المادي أو الحقيقي Physical Data Model:
بمجرد أن يتم توضيح المفاهيم الأساسية لبيانات الأعمال التجارية من خلال النموذج المفاهيمي و تمثيل الخارطة التقنية من خلال النموذج المنطقي يتم البدء بتنفيذ النموذج المادي للبيانات والذي يصف تنفيذ نظام البيانات في نظام إدارة قواعد بيانات.
تفاصيل المستويات الثلاث لنمذجة البيانات:
عناصر المستوى المفاهيمي:
- الكيان Entity
- السمة Attribute
- العلاقة Relationship
مثال توضيحي:
يوجد في الشكل أدناه ثلاث كيانات (الطالب، المادة، المعلم) تمثل ثلاث مجموعات بيانات مختلفة تحمل كل مجموعة بيانات عدة سمات كاسم الطالب ورقمه المسجل في النظام إلخ … بالإضافة إلى العلاقة التي تربط كل مجموعة مع الأخرى كعلاقة الواحد لواحد one to one أو اثنين لواحد two to one.
كما أشرنا سابقًا الأمر الذي نركز عليه في النموذج المفاهيمي هو عمل تغطية عالية المستوى High level غير تفصيلية لبيانات الأعمال التجارية ولكن بنفس الوقت يجب أن تضم هذه التغطية نموذجًا يحتوي جميع الكيانات والسمات والعلاقات بين هذه البيانات.
عناصر المستوى المنطقي:
- الكيان Entity
- السمة Attribute
- العلاقة Relationship
- نوع بيانات كل سمة Attribute Type
- حدود السمة Attribute Restriction
بالإضافة إلى القائمة السابقة في النظام المفاهيمي يتم تحديد نوع بيانات كل سمة من السمات بالإضافة إلى حدود Restrictions كالطول الأقصى لهذه البيانات length فعلى سبيل المثال يكون نوع بيانات سمة اسم الطالب على هيئة سلسلة من الأحرف string بينما سمة رقم الطالب integer و أما بالنسبة لتحديد طول الأحرف أو الأرقام فسمة كرقم الطالب يجب أن تتكون من 10 أرقام.
عناصر المستوى المادي أو الحقيقي:
- الكيان Entity
- السمة Attribute
- العلاقة Relationship
- نوع بيانات كل سمة Attribute Type
- حدود السمة Attribute Restriction
- مفاتيح السمات Attribute Keys
- الفهارس Indices
- المخططات Schemas
يعد النموذج المادي أو الحقيقي النموذج الأكثر تفصيلًا ويتكون من جميع ماسبق بالإضافة إلى ميزات متقدمة كمفاتيح السمات والفهارس التي تستخدم لتسهيل عملية البحث عن السجلات و الحدود المتقدمة وغيرها من الميزات الأخرى والتي يتم تصميمها من خلال نظام لإدارة قواعد البيانات Database Management System لتوليد مخطط متكامل لقاعدة البيانات Database Schema
العمليات الأساسية لنمذجة البيانات :
- تعريف الكيانات Entities (مجموعات البيانات أو جداول البيانات).
- تعريف السمات لكل كيان.
- تعريف العلاقات بين الكيانات.
- مطابقة أو موائمة السمات مع الكيانات بشكل كلي
- تعيين المفاتيح الأساسية و الخارجية.
- تحديد نوع أو درجة التسوية normalization التي تقلل من مستوى التكرارت.
- التحقق والإنتهاء من نموذج البيانات
الفوائد المحققة من تصميم و نمذجة البيانات :
في حال تم تصميم نموذج بيانات مفصل ودقيق للبيانات المجدولة في المؤسسة فإن الفوائد المحققة عديدة نذكر منها:
- تسهيل وتسريع عملية تصميم قواعد البيانات.
- تحسين أداء قواعد البيانات.
- تقليل التكاليف.
- تقليل نسبة الأخطاء في برمجيات قواعد البيانات (تحسين عمليات جودة البيانات).
- تحسين التواصل بين المطورين ووحدات ذكاء الأعمال.
- توثيق أفضل للبيانات حيث تكون قابلة للفهم والتتبع عند الاطلاع عليها.