اليوم انتهيت من شهادة احترافية في تحليل بيانات جوجل

التي تقدمها Google وCoursera وأرغب في تقديم تقييمي وملاحظات الدورة التدريبية.

هناك ثماني دورات عليك إكمالها قبل الحصول على الشهادة النهائية:

المهارات التي سوف تكسبها

  • اكتساب فهم شامل للممارسات والعمليات التي يستخدمها محلل بيانات مبتدئ أو مشارك في وظيفته اليومية

  • تعلم المهارات التحليلية الأساسية (تنظيف البيانات وتحليلها وتصورها) والأدوات (جداول البيانات، SQL، برمجة R، Tableau)

  • فهم كيفية تنظيف البيانات وتنظيمها للتحليل، وإكمال التحليل والحسابات باستخدام جداول البيانات وبرمجة SQL وR

  • تعرف على كيفية تصور نتائج البيانات وتقديمها في لوحات المعلومات والعروض التقديمية ومنصات التصور شائعة الاستخدام

     

قم بشراء كتالوج ملاحظات تحليلات البيانات الكامل

 

الشهادة النهائية

شهادة احترافية في تحليل بيانات جوجل

إذا أضفت أيضًا ملاحظاتي وملخصًا لكل دورة تدريبية بما في ذلك مقتطفات التعليمات البرمجية والمفاهيم والأشياء الأخرى التي قد تحتاجها لاجتياز الدورة التدريبية، فقم بتلخيص ما تعلمته واحتفظ بالملاحظات لأنها قد تكون مفيدة عندما تحتاج إليها

يمكنك تحميل مجموعتي من الملخصات والمذكرات من الروابط أدناه:

برمجة R 

تحليلات اكسل

تصورات البيانات

برمجة SQL

مراجعة الفيديو

ملخص المفاهيم التي ستتعلمها:

# الخطوات الست في عملية تحليل البيانات
طرح الأسئلة وتحديد المشكلة.
إعداد البيانات من خلال جمع المعلومات وتخزينها.
معالجة البيانات عن طريق تنظيف المعلومات والتحقق منها.
تحليل البيانات للعثور على الأنماط والعلاقات والاتجاهات.
مشاركة البيانات مع جمهورك.
التصرف بناءً على البيانات واستخدام نتائج التحليل.

# النظام البيئي للبيانات
العناصر المختلفة التي تتفاعل مع بعضها البعض لإنتاج البيانات وإدارتها وتخزينها وتنظيمها وتحليلها ومشاركتها.

# عقلية فنية
المهارة التحليلية التي تتضمن تقسيم العمليات إلى خطوات أصغر والعمل معها بطريقة منظمة ومنطقية

# تصميم البيانات
المهارات التحليلية التي تتضمن كيفية تنظيم المعلومات

# علم البيانات
مجال من مجالات الدراسة يستخدم البيانات الأولية لإنشاء طرق جديدة لنمذجة وفهم المجهول

استراتيجية البيانات #
إدارة الأشخاص والعمليات والأدوات المستخدمة في تحليل البيانات

تحليل الفجوة #
طريقة لفحص وتقييم الوضع الحالي للعملية من أجل تحديد فرص التحسين في المستقبل

# لغة الاستعلام
لغة برمجة حاسوبية تستخدم للتواصل مع قاعدة البيانات

# دورة حياة البيانات مقابل تحليل البيانات
تتناول دورة حياة البيانات المراحل التي تمر بها البيانات خلال عمرها الإنتاجي؛ تحليل البيانات هو عملية تحليل البيانات.

صيغة # مقابل الوظيفة
الصيغة هي مجموعة من التعليمات المستخدمة لإجراء عملية حسابية محددة؛ الوظيفة هي أمر محدد مسبقًا يقوم تلقائيًا بتنفيذ عملية محددة

# المشكلات الست التي يتعامل معها محلل البيانات:
يتنبأ
تصنيف الأشياء
###### يعد محلل البيانات الذي يحدد الكلمات الرئيسية من مراجعات العملاء ويصنفها على أنها إيجابية أو محايدة مثالاً على تصنيف الأشياء.
اكتشاف شيء غير عادي
###### قد يتضمن نوع مشكلة اكتشاف شيء غير عادي محلل بيانات يفحص سبب احتواء مجموعة البيانات على نقطة بيانات مفاجئة ونادرة. اكتشاف شيء غير عادي يتعامل مع تحديد وتحليل شيء خارج عن المألوف.
-تحديد المواضيع
###### قد يعتمد مصممو تجربة المستخدم (UX) على المحللين لتحليل بيانات تفاعل المستخدم. على غرار المشكلات التي تتطلب من المحللين تصنيف الأشياء، قد تتطلب مشاريع تحسين سهولة الاستخدام من المحللين تحديد الموضوعات للمساعدة في تحديد أولويات ميزات المنتج المناسبة للتحسين. تُستخدم المواضيع غالبًا لمساعدة الباحثين على استكشاف جوانب معينة من البيانات. في دراسة المستخدم، تعتبر معتقدات المستخدم وممارساته واحتياجاته أمثلة على المواضيع.
###### الآن ربما تتساءل عما إذا كان هناك فرق بين تصنيف الأشياء وتحديد الموضوعات، وأفضل طريقة للتفكير في الأمر هي أن تصنيف الأشياء بشكل عام يصنف نفس الأشياء معًا، مثل درجة المنتج 10، بينما تحديد الموضوعات يصنف بشكل متشابه الأشياء التي قد لا تكون هي نفسها، مثل تعليقات المستخدمين الإيجابية؛ يقول كل مستخدم شيئًا مختلفًا، لكنهم ينقلون أشياء إيجابية حول المنتج، وهو ما يصبح موضوعًا.-اكتشاف الاتصالات
-البحث عن الأنماط
###### يتعامل العثور على الأنماط مع تحديد الاتجاهات في مجموعة البيانات.

الأسئلة الذكية # هي:
-محدد: هل السؤال له سياق ومعالجة المشكلة. والقيام بالإجابات تساعد في جمع المعلومات
لعنصر محدد فقط أو العناصر ذات الصلة الوثيقة.
- قابلة للقياس: يمكن قياس الإجابات وجمعها لتصنيفها وتقييمها لمعرفة أيها أكثر وأقل
مهم
- موجه نحو العمل: عندما يتم الإجابة عليه يساعد في اتخاذ القرارات التي تركز على حل مشكلة معينة أو الاختراع
ميزة جديدة.
-ذات الصلة: هل يتعلق الأمر بالمشكلة؟
-مقيدة بالوقت: هل ستحل الإجابات المشكلة عاجلاً أم آجلاً؟ يمكن إنشاء خطة لتنفيذها
الحلول التي يفضلها المشترون وتقليص الميزات الأقل أهمية؟

# التفكير المنظم
الكشف عن الفجوات والفرص
التعرف على المشكلة أو الوضع الحالي
تنظيم المعلومات المتوفرة

# تصنيف الأشياء يتضمن تخصيص العناصر إلى فئات. إن تحديد المواضيع يأخذ تلك الفئات خطوة أخرى إلى الأمام، حيث يقوم بتجميعها في مواضيع أو تصنيفات أوسع.

# البيانات النوعية مقابل البيانات الكمية
يمكن أن تساعد البيانات النوعية المحللين على فهم بياناتهم الكمية بشكل أفضل من خلال تقديم سبب أو شرح أكثر شمولاً. بمعنى آخر، البيانات الكمية عمومًا تمنحك ماذا، والبيانات النوعية عمومًا تمنحك السبب

تقوم لوحات المعلومات # بمراقبة البيانات المباشرة والواردة من مجموعات بيانات متعددة وتنظيم المعلومات في موقع مركزي واحد.

# البيانات مقابل المقاييس
البيانات هي مجموعة من الحقائق. المقاييس هي أنواع بيانات قابلة للقياس الكمي تستخدم للقياس

خوارزمية #
عملية أو مجموعة من القواعد الواجب اتباعها لمهمة محددة

# متري
المقياس هو نوع واحد من البيانات القابلة للقياس الكمي المستخدم عند تحديد الأهداف وتقييمها.

# التفكير المنظم هو عملية التعرف على المشكلة أو الوضع الحالي، وتنظيم المعلومات المتاحة، والكشف عن الفجوات والفرص، وتحديد الخيارات.

# وظيفة مقابل الصيغة

يتم إنشاء الصيغ من قبل المستخدم، في حين أن الوظائف هي أوامر محددة مسبقًا في جداول البيانات

# الأسئلة الأربعة لاستراتيجية الاتصال الفعال (تستخدم بشكل رئيسي في رسائل البريد الإلكتروني)
من هو جمهورك؟
ماذا يعرفون بالفعل؟
ما الذي تحتاج إلى معرفته؟
كيف يمكنك توصيل ما يحتاجون إلى معرفته بشكل أفضل؟

# بيانات الطرف الأول
البيانات التي تجمعها بنفسك

# بيانات الطرف الثاني
البيانات التي يتم جمعها مباشرة من قبل مجموعة أخرى ومن ثم بيعها.

# بيانات الطرف الثالث
قد تأتي بيانات الطرف الثالث من عدد من المصادر المختلفة.
يتم بيع بيانات الطرف الثالث بواسطة موفر لم يجمع البيانات بنفسه.

# إذا كنت تقوم بجمع بياناتك الخاصة، فاتخذ قرارات معقولة بشأن حجم العينة

# قد تكون العينة العشوائية من البيانات الموجودة مناسبة لبعض المشاريع

المراقبة # هي طريقة جمع البيانات التي يستخدمها العلماء غالبًا.

# البيانات الأولية
جمعها الباحث من مصادر مباشرة
على سبيل المثال: بيانات من مقابلة أجريتها

# البيانات الثانوية
تم جمعها من قبل أشخاص آخرين أو من أبحاث أخرى
البيانات الديموغرافية التي تم جمعها من قبل الجامعة

# البيانات المستمرة
البيانات التي يتم قياسها ويمكن أن يكون لها أي قيمة رقمية تقريبًا
ارتفاع الأطفال في الصف الثالث (52.5 بوصة، 65.7 بوصة)

# بيانات منفصلة
البيانات التي يتم عدها ولها عدد محدود من القيم
عدد الأشخاص الذين يزورون المستشفى بشكل يومي (10، 20، 200)

# البيانات الاسمية
نوع من البيانات النوعية التي لا يتم تصنيفها بترتيب محدد
عميل لأول مرة، عميل عائد، عميل منتظم

# البيانات الترتيبية
نوع من البيانات النوعية ذات ترتيب أو مقياس محدد
تقييمات الفيلم (عدد النجوم: نجمة واحدة، نجمتان، 3 نجوم)

# البيانات المنظمة
البيانات منظمة بتنسيق معين، مثل الصفوف والأعمدة
تقارير النفقات

# البيانات غير المنظمة
البيانات غير المنظمة بأي طريقة يمكن التعرف عليها بسهولة
منشورات مواقع التواصل الاجتماعي

# نمذجة البيانات هي عملية إنشاء الرسوم البيانية التي تمثل بشكل مرئي كيفية تنظيم البيانات وتنظيمها.

تسمى هذه التمثيلات المرئية نماذج البيانات
أنواع نمذجة البيانات #
###### تمنحك نمذجة البيانات المفاهيمية عرضًا عالي المستوى لبنية البيانات الخاصة بك، مثل الطريقة التي تريد أن تتفاعل بها البيانات عبر المؤسسة.
###### تركز نمذجة البيانات المنطقية على التفاصيل الفنية للنموذج مثل العلاقات والسمات والكيانات
###### يجب أن تصور نمذجة البيانات المادية في الواقع كيفية إنشاء قاعدة البيانات. في هذه المرحلة، أنت تحدد كيفية وضع كل قاعدة بيانات وكيف ستتفاعل قواعد البيانات والتطبيقات والميزات بتفاصيل محددة
# تقنيات نمذجة البيانات
تعد ERDs طريقة مرئية لفهم العلاقة بين الكيانات في نموذج البيانات
UMLs عبارة عن مخططات تفصيلية للغاية تصف بنية النظام من خلال إظهار كيانات النظام وسماته وعملياته وعلاقاته
# تحويل البيانات هو عملية تغيير تنسيق البيانات أو بنيتها أو قيمها
# البيانات الطويلة هي البيانات التي يكون فيها كل صف بمثابة نقطة بيانات لموضوع فردي. يحتوي كل موضوع على بيانات في صفوف متعددة.
البيانات العريضة # هي البيانات التي يحتوي فيها كل موضوع على صف واحد به أعمدة متعددة لقيم السمات (أو المتغيرات) المختلفة للموضوع
# يقوم عامل التشغيل المنطقي Or بتوسيع عدد النتائج عند استخدامه في البحث عن الكلمات الرئيسية

# إلغاء تحديد الهوية
عملية تستخدم لمسح البيانات من جميع معلومات التعريف الشخصية
# قاعدة البيانات العلائقية هي قاعدة بيانات تحتوي على سلسلة من الجداول التي يمكن ربطها لإظهار العلاقات.
في الأساس، فهي تسمح لمحللي البيانات بتنظيم البيانات وربطها بناءً على ما هو مشترك بين البيانات.
# قاعدة البيانات العلائقية هي قاعدة بيانات تحتوي على سلسلة من الجداول التي يمكن ربطها لإظهار العلاقات.
في الأساس، فهي تسمح لمحللي البيانات بتنظيم البيانات وربطها بناءً على ما هو مشترك بين البيانات.
# المفتاح الأساسي
معرف فريد في جدول يشير إلى عمود تكون فيه قيمة هذا المفتاح في كل صف فريدة.
# المفتاح الخارجي
حقل في جدول وهو مفتاح أساسي في جدول آخر.
# يمكن أن يحتوي الجدول على مفتاح أساسي واحد فقط، ولكن يمكن أن يحتوي على مفاتيح خارجية متعددة.
هذه المفاتيح هي التي تنشئ العلاقات بين الجداول في قاعدة البيانات العلائقية،
مما يساعد على تنظيم البيانات وربطها عبر جداول متعددة في قاعدة البيانات.
# تطبيع قاعدة البيانات هو أسلوب لتقليل تكرار البيانات
# المخطط هو وسيلة لوصف كيفية تنظيم شيء ما
# يمثل مخطط قاعدة البيانات أي نوع من البنية التي يتم تطبيقها على قاعدة البيانات

# هناك مخططان شائعان الاستخدام هما مخططات النجوم ومخططات ندفة الثلج
مخطط النجمة # بسيط، وغير طبيعي، ويحتوي على الكثير من البيانات المتكررة
# مخطط ندفة الثلج معقد، وتم تطبيعه، ويحتوي على القليل جدًا من البيانات الزائدة عن الحاجةقبرصي

مخطط عمودي #
يعد المخطط العمودي فعالاً في إظهار الاختلافات بين عدة عناصر في نطاق محدد من القيم
# الرسم البياني الخطي
تعتبر المخططات الخطية فعالة لإظهار الاتجاهات والأنماط، مثل كيفية تغير السكان بمرور الوقت.
# تشير البيانات التعريفية الهيكلية إلى عدد المجموعات التي توجد فيها البيانات بالضبط.
فهو يوفر معلومات حول كيفية تنظيم جزء من البيانات وما إذا كانت جزءًا من مجموعة بيانات واحدة أو أكثر.
تضمن حوكمة البيانات # إدارة أصول بيانات الشركة بشكل صحيح.
# يعد تاريخ ووقت إنشاء قاعدة البيانات مثالاً لبيانات التعريف الإدارية.
يستبدل الرمز المميز # عناصر البيانات التي تريد حمايتها بالبيانات التي يتم إنشاؤها عشوائيًا والمشار إليها باسم "الرمز المميز".
يتم تخزين البيانات الأصلية في موقع منفصل وتعيينها إلى الرموز المميزة.
للوصول إلى البيانات الأصلية الكاملة، يحتاج المستخدم أو التطبيق إلى الحصول على إذن لاستخدام البيانات المميزة وتعيين الرمز المميز.
وهذا يعني أنه حتى لو تم اختراق البيانات المميزة، فإن البيانات الأصلية تظل آمنة ومأمونة في موقع منفصل.

**يجب أن يفكر محللو البيانات في تعديل هدف العمل عندما لا تتوافق البيانات مع الهدف الأصلي وعندما لا تكون هناك بيانات كافية لتحقيق الهدف**

**يجب أن تتوافق البيانات المستخدمة للتحليل مع أهداف العمل وتساعد في الإجابة على أسئلة أصحاب المصلحة**

# ماذا تفعل عندما تجد مشكلة في بياناتك

## مشكلة البيانات 1: لا توجد بيانات

إذا لم يكن هناك وقت لجمع البيانات، فقم بإجراء التحليل باستخدام بيانات الوكيل من مجموعات البيانات الأخرى. _هذا هو الحل البديل الأكثر شيوعًا._

إذا كنت تقوم بتحليل أوقات ذروة السفر للمسافرين ولكن ليس لديك البيانات الخاصة بمدينة معينة، فاستخدم البيانات من مدينة أخرى بنفس الحجم والديموغرافية.

## مشكلة البيانات 2: بيانات قليلة جدًا

قم بإجراء التحليل باستخدام بيانات الوكيل إلى جانب البيانات الفعلية.

إذا كنت تقوم بتحليل الاتجاهات لأصحاب كلاب جولدن ريتريفر، فاجعل مجموعة البيانات الخاصة بك أكبر من خلال تضمين البيانات من أصحاب اللابرادور.

اضبط تحليلك ليتوافق مع البيانات الموجودة لديك بالفعل.

إذا كانت بياناتك مفقودة بالنسبة للأشخاص الذين تتراوح أعمارهم بين 18 و24 عامًا، فقم بإجراء التحليل ولكن لاحظ القيد التالي في تقريرك: _ينطبق هذا الاستنتاج على البالغين من عمر 25 عامًا فما فوق_ _فقط_.

## مشكلة البيانات 3: بيانات خاطئة، بما في ذلك البيانات التي تحتوي على أخطاء

الحلول الممكنة

إذا كانت لديك بيانات خاطئة بسبب سوء فهم المتطلبات، فقم بتوصيل المتطلبات مرة أخرى.

إذا كنت بحاجة إلى بيانات الناخبات وتلقيت بيانات الناخبين الذكور، فأعد ذكر احتياجاتك.

تحديد الأخطاء في البيانات، وإذا أمكن، تصحيحها في المصدر من خلال البحث عن نمط في الأخطاء.

إذا كانت بياناتك موجودة في جدول بيانات وكان هناك عبارة شرطية أو عبارة منطقية تتسبب في خطأ الحسابات، فقم بتغيير العبارة الشرطية بدلاً من إصلاح القيم المحسوبة فقط.

إذا لم تتمكن من تصحيح أخطاء البيانات بنفسك، فيمكنك تجاهل البيانات الخاطئة والمضي قدمًا في التحليل إذا كان حجم عينتك لا يزال كبيرًا بدرجة كافية ولن يؤدي تجاهل البيانات إلى التحيز المنهجي.

إذا تمت ترجمة مجموعة البيانات الخاصة بك من لغة مختلفة وكانت بعض الترجمات غير منطقية، فتجاهل البيانات ذات الترجمة السيئة وتابع تحليل البيانات الأخرى.

![[ملاحظات جمع البيانات.jpg]]

**سكان**

المجموعة بأكملها التي تهتم بها لدراستك. على سبيل المثال، إذا كنت تقوم باستقصاء آراء الأشخاص في شركتك، فسيكون عدد السكان هو جميع الموظفين في شركتك.

**عينة**

مجموعة فرعية من سكانك. تمامًا مثل عينة الطعام، تسمى عينة لأنها مجرد طعم. لذلك، إذا كانت شركتك كبيرة جدًا بحيث لا تتمكن من إجراء مسح لكل فرد، فيمكنك إجراء مسح لعينة تمثيلية من سكانك.

** هامش الخطأ **

نظرًا لأنه يتم استخدام العينة لتمثيل المجتمع، فمن المتوقع أن تختلف نتائج العينة عما كانت ستكون عليه النتيجة لو قمت بمسح جميع السكان. ويسمى هذا الاختلاف هامش الخطأ. كلما كان هامش الخطأ أصغر، كلما كانت نتائج العينة أقرب إلى النتيجة التي كانت ستكون عليها لو قمت بمسح جميع السكان.

يتم استخدام هامش الخطأ لتحديد مدى قرب نتيجة عينتك مما كان من الممكن أن تكون عليه النتيجة إذا كان بإمكانك إجراء مسح أو اختبار لجميع السكان. يساعدك هامش الخطأ على فهم وتفسير نتائج الاستطلاع أو الاختبار في الحياة الواقعية. يعد حساب هامش الخطأ مفيدًا بشكل خاص عندما يتم إعطاؤك البيانات لتحليلها. بعد استخدام الآلة الحاسبة لحساب هامش الخطأ، ستعرف مدى اختلاف نتائج العينة عن نتائج المجتمع بأكمله

**مستوى الثقة**

مدى ثقتك في نتائج الاستطلاع. على سبيل المثال، يعني مستوى الثقة 95% أنه إذا قمت بإجراء نفس الاستطلاع 100 مرة، فستحصل على نتائج مماثلة 95 من تلك المرات المائة. يتم استهداف مستوى الثقة قبل بدء دراستك لأنه سيؤثر على حجم هامش الخطأ في نهاية دراستك.

في معظم الحالات، يتم استخدام مستوى الثقة 90% أو 95%. ولكن، اعتمادًا على مجال عملك، قد ترغب في تحديد مستوى ثقة أكثر صرامة. يعتبر مستوى الثقة 99% معقولًا في بعض الصناعات، مثل صناعة الأدوية

**فاصل الثقة**

نطاق القيم المحتملة التي ستكون نتيجة المجتمع عند مستوى ثقة الدراسة. هذا النطاق هو نتيجة العينة +/- هامش الخطأ.

**دلالة إحصائية**

تحديد ما إذا كانت نتيجتك قد تكون نتيجة الصدفة العشوائية أم لا. كلما زادت الأهمية، كلما قلت الصدفة.

**لكي تكون التجربة ذات دلالة إحصائية، يجب أن تكون النتائج حقيقية وليست نتيجة مصادفة عشوائية.**

**للحصول على مستوى عالٍ من الثقة في استطلاع آراء العملاء، يجب أن يعكس حجم العينة إجمالي عدد السكان بدقة.**

## أنواع البيانات القذرة

بيانات مكررة
بيانات قديمة
بيانات غير مكتملة
بيانات غير صحيحة/غير دقيقة
بيانات غير متناسقة

** تشير القيمة الخالية إلى عدم وجود قيمة. الصفر هو استجابة رقمية.**

**تعيين البيانات هو عملية مطابقة الحقول من مصدر بيانات إلى آخر.**

وثائق #

يستخدم المهندسون **أوامر التغيير الهندسية** (ECOs) لتتبع تفاصيل تصميم المنتج الجديد والتغييرات المقترحة على المنتجات الحالية. يستخدم الكتّاب **سجلات مراجعة المستندات** لتتبع التغييرات التي تطرأ على تدفق المستندات وتعديلاتها. ويستخدم محللو البيانات **سجلات التغيير** لتتبع تحويل البيانات وتنظيفها

تعد سجلات التغيير مفيدة للغاية لمساعدتنا في فهم أسباب إجراء التغييرات. ليس لسجلات التغيير تنسيق محدد ويمكنك أيضًا إدخال إدخالاتك في مستند فارغ. ولكن إذا كنت تستخدم سجل تغيير مشترك، فمن الأفضل الاتفاق مع محللي البيانات الآخرين على تنسيق جميع إدخالات السجل الخاصة بك

ربما يحتاج المحلل المبتدئ إلى معرفة ما ورد أعلاه مع استثناء واحد فقط. إذا كان أحد المحللين يجري تغييرات على استعلام SQL موجود مشترك عبر الشركة، فمن المرجح أن تستخدم الشركة ما يسمى **نظام التحكم في الإصدار**. قد يكون أحد الأمثلة على ذلك هو الاستعلام الذي يسحب الإيرادات اليومية لإنشاء لوحة معلومات للإدارة العليا.

نظام التحكم في الإصدار #

فيما يلي كيفية تأثير نظام التحكم في الإصدار على التغيير في الاستعلام:

1. تمتلك الشركة إصدارات رسمية من الاستعلامات المهمة في **نظام التحكم في الإصدارات** الخاص بها.
2. يتأكد المحلل من أن أحدث إصدار للاستعلام هو الذي سيتم تغييره. وهذا ما يسمى **المزامنة**
3. يقوم المحلل بإجراء تغيير على الاستعلام.
4. قد يطلب المحلل من شخص ما مراجعة هذا التغيير. وهذا ما يسمى **مراجعة الكود** ويمكن إجراؤها بشكل غير رسمي أو رسمي. يمكن أن تكون المراجعة غير الرسمية بسيطة مثل مطالبة أحد كبار المحللين بإلقاء نظرة على التغيير.
5. بعد موافقة المراجع على التغيير، يرسل المحلل الإصدار المحدث من الاستعلام إلى مستودع التخزين في
6. نظام التحكم بالإصدار الخاص بالشركة. وهذا ما يسمى ** التزام التعليمات البرمجية **. أفضل الممارسات هي توثيق التغيير بالضبط وسبب إجرائه في منطقة التعليقات. بالعودة إلى مثالنا للاستعلام الذي يسحب الإيرادات اليومية، قد يكون التعليق: _إيرادات محدثة لتشمل الإيرادات القادمة من المنتج الجديد، Calypso_.
7. بعد **إرسال التغيير**، سيتمكن أي شخص آخر في الشركة من الوصول إلى هذا الاستعلام الجديد واستخدامه عند **المزامنة** مع أحدث الاستعلامات المخزنة في نظام التحكم في الإصدار.
8. إذا كان الاستعلام به مشكلة أو يحتاج العمل إلى تغيير، فيمكن للمحلل **_التراجع_** عن التغيير في الاستعلام باستخدام نظام التحكم في الإصدار. يمكن للمحلل الاطلاع على قائمة مرتبة ترتيبًا زمنيًا بجميع التغييرات التي تم إجراؤها على الاستعلام ومن قام بإجراء كل تغيير. بعد ذلك، بعد العثور على التغيير الخاص به، يمكن للمحلل **العودة** مرة أخرى إلى الإصدار السابق.
9. يعود الاستعلام إلى ما كان عليه قبل قيام المحلل بالتغيير. ويرى كل فرد في الشركة هذا الاستعلام الأصلي المعكوس أيضًا.

وبدون بيانات كافية لتحديد الاتجاهات طويلة المدى، يتمثل أحد الخيارات في التحدث مع أصحاب المصلحة والمطالبة بتعديل الهدف. يمكنك أيضًا أن تطلب الانتظار للحصول على مزيد من البيانات وتقديم جدول زمني محدث.

**القيم المتطرفة** هي نقاط بيانات تختلف تمامًا عن البيانات المجمعة بشكل مماثل وقد لا تكون قيمًا موثوقة

## الفرز مقابل التصفية

**الفرز** هو عندما تقوم بترتيب البيانات بترتيب ذي معنى لتسهيل فهمها وتحليلها وتصورها. يقوم بتصنيف بياناتك بناءً على مقياس محدد تختاره. يمكنك فرز البيانات في جداول البيانات، وقواعد بيانات SQL (عندما تكون مجموعة البيانات الخاصة بك كبيرة جدًا بالنسبة لجداول البيانات)، والجداول في المستندات.

على سبيل المثال، إذا كنت بحاجة إلى ترتيب الأشياء أو إنشاء قوائم ترتيب زمني، فيمكنك الفرز حسب الترتيب التصاعدي أو التنازلي. إذا كنت مهتمًا بمعرفة الأفلام المفضلة لمجموعة ما، فيمكنك الفرز حسب عنوان الفيلم لمعرفة ذلك. سيؤدي الفرز إلى ترتيب البيانات بطريقة مفيدة ويمنحك رؤى فورية. يساعدك الفرز أيضًا على تجميع البيانات المتشابهة معًا حسب التصنيف. بالنسبة للأفلام، يمكنك التصنيف حسب النوع، مثل الحركة أو الدراما أو الخيال العلمي أو الرومانسية.

**يتم استخدام التصفية** عندما تكون مهتمًا فقط برؤية البيانات التي تستوفي معايير محددة، وإخفاء الباقي. تعتبر التصفية مفيدة حقًا عندما يكون لديك الكثير من البيانات. يمكنك توفير الوقت من خلال التركيز على البيانات المهمة حقًا أو البيانات التي تحتوي على أخطاء أو أخطاء. تسمح لك معظم جداول البيانات وقواعد بيانات SQL بتصفية بياناتك بعدة طرق. تمنحك التصفية القدرة على العثور على ما تبحث عنه دون بذل الكثير من الجهد.

على سبيل المثال، إذا كنت مهتمًا فقط بمعرفة من شاهد الأفلام في شهر أكتوبر، فيمكنك استخدام عامل تصفية للتواريخ بحيث يتم عرض سجلات الأفلام التي تمت مشاهدتها في شهر أكتوبر فقط. بعد ذلك، يمكنك التحقق من أسماء الأشخاص لمعرفة من شاهد الأفلام في شهر أكتوبر.

**في عملية تحليل البيانات، هدف التحليل هو تحديد الاتجاهات والعلاقات ضمن تلك البيانات حتى تتمكن من الإجابة بدقة على السؤال الذي تطرحه.**

عن المؤلف

أقوم بإنشاء ملاحظات حول الأمن السيبراني وملاحظات التسويق الرقمي والدورات التدريبية عبر الإنترنت. أقدم أيضًا استشارات التسويق الرقمي بما في ذلك، على سبيل المثال لا الحصر، تحسين محركات البحث وإعلانات Google وMeta وإدارة CRM.

عرض المقالات