سنجش و اندازه گیری

پارادایم پژوهش بین رشته‏ ای (09122263167)

نمودار ساقه و برگ و نمودار جعبه ای BOXPLOT AND STEM AND LEAF DIAGRAMS

                                                                                                           

نمودار ساقه و برگ  Stem And Leaf Diagram

نمودار ساقه وبرگ نوعي نمودار براي نمايش فراواني مشاهدات می باشد و برای نمایش یک سری داده کمی گسسته و پیوسته بکار می رود. شکل و پراکندگی داده ها را نمایش می دهد. هر داده یک ساقه و یک برگ دارد. معمولا برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند . برای مثال در عدد 512 عدد 2 برگ و 51 ساقه است. يك‌ نمودار منعكس‌ كننده‌ توزيع‌ فراواني‌ و هيستوگرام‌ است‌ و ضمن‌ نشان‌ دادن‌ شكل‌ هيستوگرام‌،  داده‌ هاي‌ اصلي‌ را نيز نشان‌ مي دهد. در این نمودار بجاي رسم ميله‌ها، فراواني‌ها بشكل اعداد (با نمايش تعداد تكرار و بيان اعداد مشاهده شده) نشان داده می شوند.

برای رسم نمودار ساقه وبرگ این مراحل طی می شود:

1. هر داده  به دو قسمت تقسیم می شود. یک قسمت از داده  ساقه و قسمت دیگر برگ است. برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند. 

2. ساقه ها به ترتیب از کوچک به بزرگ مرتب می شوند. 

3. هر برگ به ساقه مناسب اضافه می شود.

برای درک بهتر، فرآیند تشکیل نمودار ساقه و برگ ارائه می شود. این مثال مربوط به داده های پزشکی است.

80, 85, 110, 95, 95, 100, 45, 95, 130, 75, 80, 70, 80, 100, 120, 110, 125, 75, 100, 40, 75, 110, 150, 75, 95

در داده های بالا عدد سمت راست برای هر داده برگ می باشد؛ مثلا برای عدد 110، 0 برگ است و 11 ساقه است. برای تمام اعداد بعد از اینکه ساقه  ها مشخص شد، باید ساقه ها از کوچک به بزرگ مرتب شوند و به صورت عمودی و یا افقی به ترتیب مشخص شده نوشت. سپس برگ ها در جلوی این ساقه ها نوشته می شوند. مناسب تر آن است که برگ ها نیز به ترتیب از کوچک تا بزرگ یعنی از صفر تا 9 مرتب شوند تا نمای بصری زیبا تر و اطلاعات در مورد داده ها با سرعت و سهولت بیشتری انتقال یابند. می توان بین ساقه ها و برگ ها خطی ترسیم نمود. این نمودار خیلی به نمودار میله ای نزدیک و شبیه است. این نمودار اطلاعات مربوط به نمودارهای میله ای و هیستوگرام را داراست ولی بیشتر از این نمودارها نیز اطلاعات می دهد و برای بررسی بیشتر داده ها نیز می توان از آن استفاده کرد. در زیر مثالی زده شده است که شکل نمودار ساقه و برگ را نشان می دهد.

 


با مقايسه نمودار فوق و نمودار هيستوگرام ديده مي‌شود كه در نمودار هيستوگرام با ايجاد طبقات ديگر دستيابي به مقادير انفرادي مشاهدات امكان پذير نيست اما در نمودار شاخه و برگ ضمن داشتن ايدة تصويري از نحوة توزيع داده ها به يكايك اطلاعات نيز دسترسي داريم.


برای رسم این نمودار در نرم افزار اس پی اس اس، به عنوان مثال، اگر بخواهيم نمودار ساقه و برگ متغير مقدار علوفه مصرفي را براساس متغير گروه‌هاي نژادي گوسفندان رسم كنيم، بعد از انتخاب گزينهDescriptive Statistics از منوي Analyze  و سپس كليك بر روي Explore…، وارد پنجره Explore مي‌شويم. حال متغير Hay را وارد جعبه Dependent List و متغير Ethnic group را وارد بخش  Factor List نموده و از قسمت Display گزينه Plots را انتخاب كرده و بر روي دكمه Plots… كليك مي‌نمائيم.

در ادامه، در پنجره Explore: Plots تنها گزينه Stem-and-Leaf را انتخاب و بترتيب بر روي كليدهاي Continue و  OK كليك مي‌كنيم.


نمودار جعبه ای (Box plot)

نمودار جعبه ای نموداري است كه به كمك معيارهاي مركزي و پراكندگي،  موقعيت مجموعه داده ها را به شكلي بسيار گويا و مفيد ارائه مي دهد. اين نمودار ابتدا توسط آمار شناس معروف توكي ارائه گرديد و  با استفاده از يك مستطيل (باكس)  در دو خط، در دو طرف مستطيل (ويسكر) و به وسيله ميانه، چاركهاي اول و سوم و كمترين و بيشترين اندازه مشاده شده رسم مي شود. با استفاده از اين نمودار مي توان مركزيت،‌ پراكندگي و چولگي داده ها را تفسير نمود.

برای رسم این نمودار:

1. داده ها را به صورت صعودی مرتب می کنیم.

2. میانه داده ها را مشخص می کنیم. 

3. (3) چارک اول و سوم را مشخص می کنیم. 

4. (4) یک خط افقی مدرج که بتوان همه داده ها را روی آن نشان داد رسم می کنیم. 

5. مکان کوچک ترین عدد مشاهده شده، بزرگ ترین عدد، میانه، چارک اول و چارک سوم را تعیین می کنیم. 

6. بالای خط مدرج رسم شده مستطیلی رسم می کنیم که طول آن برابر با Q3- Q1 (برد چارک ها) بوده و از نقطه Q1 شروع و به نقطه Q3 ختم شود و عرض این مستطیل به اندازه معقول در نظر گرفته می شود. اندازه میاننه را به صورت خطی به موازات عرض مستطیل رسم نموده و مستطیل را به وسیله یک خط منقطع به موازات خط مدرج شده به دو قسمت تقسیم می کنیم. 

7. مرزهای داخلی و خارجی داده ها را با توجه به روابطی خاص تعیین می کنیم.

8. با استفاده از داده های مرتب شده، دو اندازه کوچک ترین و بزرگ ترین داده را که داخل مرزهای داخلی قرار دارند، تعیین کرده و خط منقطع وسط مستطیل را تا این دو نقطه به صورت خط پر ادامه می دهیم. این خطوط را ویسکر می نامند که از چارک ها شروع و به نقاط فوق ختم می شوند.

نکته!

هر عددي كه خارج از مرزهاي داخلي قرار گرفته باشد را يك دادة پرت ناميده و چنانچه بين مرزهاي داخلي و خارجي قرار گيرد، آن را داده پرت ضعيف ناميده و با علامت ○ نشان مي دهيم و چنانچه خارج از مرزهاي خارجي قرار گیرد آن را داده پرت قوي که بعضی به آن داده ی انتهایی نیز می گویند ناميده و با علامت ● نشان مي دهيم.

با استفاده از نمودار جعبه ای مي توان اطلاعات زير را در مورد داده ها كسب نمود:

1. اگر ميانه نزديك وسط مستطيل باشد توزيع داده ها تقريباً متقارن است.

2. اگر ميانه در طرف چپ وسط مستطيل باشد، توزيع چوله به راست و اگر ميانه در طرف راست وسط مستطيل قرار گيرد توزيع چوله به چپ است. البته در بعضی از نرم افزارها مانند اس پی اس اس نمودار به صورت عمودی ترسیم می شود. 

3. اگر خطوط دو طرف مستطيل (ويسكرها) تقريباً برابر باشند، توزيع داده ها به توزيع متقارن نزديك بوده و در صورت نامساوي بودن خطوط توزيع داراي چولگي است.

4. در مقايسه نمودار جعبه ای دو مجموعه از داده ها مي توان پراكندگي آنها را با توجه به طول مستطيل هاي نمودار با يكديگر مقايسه نمود. مستطيلي كه طول بزرگتري دارد، داراي پراكندگي بيشتر مي باشد.

5. داده هاي پرت ضعيف و داده هاي پرت قوي را با استفاده از نمودار جعبه ای مي توان تعيين نمود.

نمودار جعبه ای برای داده های یک کلاس آمار بدین شرح است: 

2,2/25,3,3/5,4/25,5/5,6/25,6/5,7,7/25,7/5,8,8,8/5,8/5,10,10,10,10,10/5,10/75,11,11,

11/25,11/5,11/75,11/75,13,14/25,14/5,14/5,14/5,15,15,17/25,18/25     n=36


 


 

 

برای رسم این نمودار در نرم افزار اس پی اس اس، به‌عنوان مثال،  براي رسم نمودار جعبه‌اي مربوط به متغير وزن بدن گوسفندان براساس رده‌هاي مختلف گروه‌هاي نژادي و مقايسه آنها با يكديگر، بعد از انتخاب گزينه Boxplot… از منوي Graphs و سپس انتخاب حالت Simple و زدن Define، متغير Weight  را وارد قسمت Variable و متغير Ethnic group را وارد بخش  Category Axis نموده و بر روي OK كليك مي‌كنيم.


نمودار جعبه ای پهلو به پهلو

اگر براي مقايسه دو يا چند گروه مجزا نمودارجعبه‌اي را رسم و روي يك محور قرار دهيم، نمودار حاصل را نمودار جعبه‌اي پهلو به پهلو مي‌ناميم و ابزار مناسب، براي مقايسة خصوصيات اين گروهها براي صفت كمي مورد مطالعه در اختيار ما قرار مي‌دهد.


مثال : در مقايسه اثرات جانبي دارويي بر فشار خون افراد در دو گروه بيماري حاد و مزمن نمودارهاي زير از فشار خون آنها پس از مصرف دارو تهية شده است.
 نمودار فوق نشان مي‌دهد، پراكندگي و تمركز هردو در فشار خون بيماران مبتلا به بيماري حاد بيشتر از گروه بيماران مبتلا به بيماري مزمن مي‌باشد. لذا اثر جانبي اين دارو براي بيماري حاد نامناسب‌تر به نظر مي‌رسد.
 در نهایت این دو نمودار در یک نمایش تصویری از داده ها کاربرد دارند اما نمودار جعبه ای زمانی مورد استفاده قرار می گیرد که هدف، تاکید بر نقاط مشخصی از توزیع برای ارائه اطلاعات به صورت  خلاصه شده می باشد. همچنین این نمودار انجام‌ مقايسه‌ بين‌ چند مجموعه‌ داده‌ را به‌ آساني‌ امكان‌ پذيرمي‌سازد. 

 نمودار ساقه و برگ برای توصیف داده های کمی به کار برده می شود و رسم آن به دلیل از دست ندادن اطلاعات به دیگر نمودارهای فراوانی ترجیح داده می شود.
+ نوشته شده در  سه شنبه ۲۹ آذر۱۳۹۰ساعت   توسط محمد حسین ضرغامی  |