الإدارة السليمة تعتمد على المعلومات السليمة ولذلك فإن المديرين يحتاجون أن يتعاملوا مع البيانات وأن يستنبطوا منها معلومات تساعدهم على اتخاذ القرارات. على الجانب الآخر فإن المهندسين الصناعيين يستخدمون البيانات في دراساتهم لتحسين العمليات وهم يستخدمون أدوات متقدمة لتحليل البيانات.
أحاول في هذه المقالة والمقالات التالية تقديم بعض الأساليب البسيطة لتلخيص البيانات واستخراج معلومات مفيدة منها.
تلخيص البيانات
افترض أنك حصلت على معلومات حول درجات الطلاب في الامتحان أو درجات حرارة الجو في في كل يوم خلال شهر ما أو حجم المبيعات في كل شهر خلال العام أو عدد العيوب في المنتج خلال فترات دورية أو ما شابه ذلك. كيف يمكننا شرح هذه البيانات باستخدام عدد قليل من الأرقام؟ كيف يمكننا التعليق على هذه البيانات ومقارنتها ببيانات فترة أو فترات سابقة؟ قد يتبادر لذهنك المتوسط الحسابي وهو فعلا أحد وسائل وصف البيانات ولكن هناك أرقاما اخرى تصف لنا هذه البيانات.
المتوسط الحسابي Average or Mean: المتوسط الحسابي هو من الأرقام التي يشيع استخدامها نظرا لبساطته ولكونه مؤشرا عاما يمكن أن يعبر عن كل البيانات. ولكن المتوسط الحسابي لا يعبر تعبيرا كاملا عن البيانات ولذلك فإن هناك أرقاما أخرى لها أهميتها.
المتوسط الحسابي سهل في حسابه فهو حاصل قسمة مجموع البيانات على عددها. على سبيل المثال لو كانت البيانات عبارة عن درجة حرارة الجو خلال ست ساعات وكانت درجة الحرارة في كل ساعة كالتالي:
105، 107، 111، 108، 104، 109
فإن المتوسط الحسابي يكون (105+107+111+108+104+109)\6= 644\6= 107.3 درجة مئوية
وهكذا فإننا نستطيع أن نقول إن درجة الحرارة المتوسطة خلال الست ساعات هي 107.3 درجة مئوية. هذا الرقم يعطينا انطباعا عاما عن درجة الحرارة خلال الفترة كلها. ويمكننا استخدام هذا الرقم لمقارنة درجة حرارة اليوم بالأمس.
الوسيط Median: الوسيط هو رقم غير شائع الاستخدام والكثيرون لا يعرفونه أصلا مع أن دلالته قوية وفهمه أيسر من فهم المتوسط الحسابي. الوسيط هو رقم مشابه للمتوسط الحسابي ولكنه يعني ببساطة:
إن 50% من البيانات أقل من هذه القيمة و50% من البيانات أعلى من هذه القيمة.
فمثلا لو كانت درجات تسعة طلبة هي:
97، 90، 80 ، 95، 83، 64، 77، 90، 84
فإن الوسيط يكون 84 لأن أربعة طلبوا حصلوا على درجة أعلى من تلك الدرجة وأربعة طلبة حصلوا على درجة أقل من تلك الدرجة. وبالتالي يكون 50% من الطلبة حصلوا على أعلى من 84 و50% حصلوا على أقل من 84.
وللوسيط أهمية عندما تكون هناك قيم قليلة متطرفة أي أن قيمتها تبتعد كثيرا عن باقي البيانات. ففي المثال السابق فإن المتوسط الحسابي هو 760\9= 84.4 وهي قيمة تقترب كثيرا من قيمة الوسيط. ولكن ماذا لو كانت درجة الطالب الذي حصل على 64 في المثال السابق هي 25 درجة فقط. في هذه الحالة لا يتغير الوسيط ولكن المتوسط الحسابي يصبح 80 وهي قيمة تقل عن الوسيط بسبب وجود قيمة واحدة قليلة جدا. في هذه الحالة تجد أن الوسيط يعطيك معنى أفضل. وعلى كل حال فإن المتوسط والوسيط قد يستخدمان معا.
وعند التعليق على البيانات فإنه لا يلزم أن تستخدم لفظ وسيط فقد لا يفهمك الآخرون ولكن يمكنك أن توضح أن 50% من الطلبة حصلوا على أعلى من 84 درجة. وبالطبع فإن المستمع يفهم أن الـ 50% الآخرين حصلوا على أقل من 84 درجة.
قد يكون عدد البيانات هو رقم زوجي مثل أن يكون عدد الطلبة هو 10 وليس 9. في هذه الحالة فإن الوسيط يكون هو متوسط القيميتن المتوسطتين.
مثال: درجات الطلبة هي:
70، 90، 85، 95، 100، 10، 80، 96، 86، 92
نقوم بترتيب البيانات تصاعديا:
10، 70، 80، 85، 86، 90، 92، 95، 96، 100
فيكون الوسيط هو متوسط الرقمين: 86 و 90 أي 88
لاحظ أن المتوسط هنا هو 80.4 نظرا لوجود قيمة متطرفة جدا هي 10.
مثال: لدينا سرعة عشر سيارات مرت خلال الخمس دقائق الماضية على طريق ما وهي كالتالي:
100، 90، 80، 95، 85، 90، 82، 77، 90، 76
في هذه الحالة يكون المنوال هو 90 لأن هذه السرعة تكررت ثلاث مرات. وهذا يعني أن سرعة 90 كم/ساعة هي السرعة الأكثر شيوعا بين هذه السيارات العشر ومن الطبيعي أن تكون سيارات كثيرة سرعتها تقترب من هذه القيمة.
قد يكون هناك اكثر من منوال عند تساوي تكرار قيمتين وقد لا يكون هناك أي منوال عندما لا تتكرر أي قيمة.
الربعين الادنى والأعلى Quartiles: الربعين الأدنى والأعلى هما مماثلان للوسيط ولكنهما يمثلان نسبة 25% و75% أي القيمة التي يكون 25% من البيانات أقل منها والقيمة التي يكون 75% من البيانات أقل منها.
هذه القيم تساعدنا كثيرا على فهم البيانات ومقارنتها ببيانات مماثلة لفترة سابقة أو مدرسة أخرة أو شركة أخرى وهكذا.
قيمة الربع الأدنى هي قيمة الملاحظة (البيان) المناظر لـ
0.25*(عدد المشاهدات أو البيانات + 1)
أما قيمة الربع الأعلى فهي القيمة المناظرة لـ
0.75*(عدد المشاهدات أو البيانات + 1)
كما في حساب الوسيط فإن قيمة كلا من الربع الأدنى والأعلى قد تصادف بيانا بعينه أو تكون قيمة متسطة بين قيمتين.
مثلا إذا كانت البيانات تمثل درجات 1 طالبا فإن قيمة الربع الأدنى تكون هي القيمة المناظرة لـ
0.25*(11+1)=3
وقيمة الربع الأعلى تكون القيمة المناظرة لـ
0.75*(11+1)=9
فلو كانت الدرجات كالتالي:
35، 40، 66، 76، 80، 82، 86، 90، 94، 95، 96
فإن قيمة الربع الأدنى تكون 66 وقيمة الربع الأعلى تكون 90 أي أن 25% من الطلبة حصلوا على أقل من 66 و75% من الطلبة حصلوا على أقل من 90.
أما لو كان عدد الطلبة 12 مثلا فإن القيمة المطلوبة تكون قيمة متوسطة بين قيمتين.
وأسلوب الحساب ليس مهما بالنسبة لنا لأننا نستخدم الحاسوب والذي سيقوم بحساب كل هذه القيم لك. من أشهر البرامج التي تقوم بذلك برنامج إكسل الواسع الانتشار وبرنامج SPSS المتخصص في الإحصاء. وهناك مواقع على الإنترنت قد توفر ذلك مجانا كذلك. فالمهم هو فهم معنى كل رقم من هذه الأرقام.
وعند استخدام هذه الأرقام في مجال العمل فإنه من الأفضل أن تشرحها في تعليقك على البيانات بمعنى ان تقول أن 75% من الطلبة حصلوا على درجة أعلى من كذا. فإن القارئ أو المستمع ربما ينزعج عند استخدامك لمصطلح لا يعرفه مثل مصطلح الربع الأدنى أو الأعلى ولكنه يستطيع فهم الجملة السابقة بسهولة.
في المقالات التالية إن شاء الله نستكمل الحديث لنوضح أرقاما أخرى ونبين كيفية استخدام برنامج إكسل للقيام بكل تلك الحسابات.
------------------------------
من مراجع الموضوع:
Lean Six Sigma Pocket ToolBook, M. George at al., MCGrawHill, 2005
Applied Statistical Methods, W. Carlson and B. Thorne, Prentice Hall, 1997
Statistics for Managers, Levine et al., Prentice Hall, 1999