آزمون  كای­دو()

توزیع کای دو

آزمون کای دو یک آزمون ناپارامتریك است كه توسط فیشر ارائه شده  و كار اصلی آن، بررسی معناداری تفاوت بین فراوانی­های مشاهده شده و مورد انتظار است . فرمول كلی كای­دو به شكل زیر می­باشد.

 فراوانی مشاهده شده

  :  فراوانی مورد انتظار

توزیع كای­دو از توزیع نرمال بدست می­آید. اگر متغیر x متعلق به جامعه نرمال با میانگین  و انحراف معیار  باشد و از این جامعه نمونه تصادفی به حجم n انتخاب شود، سپس هریك از اعضای نمونه با استفاده از فرمول z= استاندارد شوند، متغیر تصادفی زیراز توزیع کای­دو با n درجه آزادی پیروی می­كند.

 توزیع كای دو دارای رابطه ای به شكل زیر می باشد كه در آن k در جه آزادی را نشان می­دهد و میانگین و وایانس آن به ترتیب k و2k  می­باشد.

F(x)=***

نحوه عملكرد آزمون كای دو

جمع­آوری اطلاعات، مقداری را برای فراوانی در سلول­ها نشان می­دهد. به این فراوانی­ها، فراوانی مشاهده شده گویند. از طرفی در صورتی كه طبق فرض صفر استقلال بین دو متغیر وجود داشته باشد، انتظار داریم فراوانی­ها به شكل دیگری باشد. طبیعی است كه بین این دو نوع فراوانی اختلاف وجود داشته باشد. در صورتی كه اختلاف قابل توجه نباشد،  می­توانیم فرض مورد نظر را بپذیریم.

در غیر این صورت فرض صفر رد می شود. علت تقسیم كسر( بر    نرمالایز كردن یا بی­مقیاس كردن داده­هاست.

 شرایط استفاده از آزمون كای دو

1- تصادفی بودن داده­ها

2-مستقل بودن نمونه­ها

3-بزرگ بودن نمونه به اندازه كافی

گفته می شود فراوانی سلول­ها نباید كمتر از 10(به عقیده بعضی­ها 5) باشد. در صورتی كه این اتفاق بیافتد باید طبقات ادغام شود. به همین دلیل بعضی از محققین اعتقاد دارند برای انجام آزمون كای­دو تعداد نمونه­ای بزرگتر از 50 مورد نیاز است. در نرم افزار  spss  در صورت وجود سلول­هایی با فراوانی كمتر از 5 به مقدار بیش از 20% سلول­ها هشدار داده می شود، این بدین معنی­ست كه تست­ كای­دو، قدرت لازم را جهت انجام آزمون ندارد.

4-آزمون كای دو  برای متغیر­های رتبه­ای و اسمی استفاده می­شود.

 مراحل آزمون كای دو

1-فراوانی های مورد انتظار را با استفاده از توزیع مورد آزمون تعیین كنید.

2-آماره  را تعیین كنید.

3- مقدار بحرانی را از جدول كای­دو با سطح خطای مورد نظر و درجه آزادی N-K-1  محاسبه نمایید. که در آن N تعداد طبقات و K تعداد متغیرهای برآورد شده می­باشد.

4- تصمیم گیری كنید.

 آزمون نیکویی برازش، ميزان تناسب و ارزش يكسري از داده‌ها را با يك توزيع خاص مثل توزيع نرمال يا پواسون  بررسي مي كند. در صورتي‌كه داده‌ها از شكل توزيع فاصله زيادي نداشته باشند برازش داده‌ها با آن توزيع تعيين و در غير اين صورت رد مي‌شود. روش آزمون در اين جا نيز مانند 2 كاربرد دیگر آزمون کای‌دو است بدين معنا كه با محاسبه مقادير فراواني مورد انتظار اين مقادير در قالب رابطه توزيع با فراواني‌هاي واقعي يا مشاهده شده مقايسه مي‌شود و در نهايت با مقايسه آماره حاصل با حدود بحراني برازش داده‌ها مشخص مي‌شود .

مثـال : فرض كنيد براي بررسي سالم بودن يك تاس 300 بار آن را پرتاب كرده كه توزيع نتايج اين 300 بار بين اعداد 1 تا 6 به صورت جدول زير است . (فقط قسمت سفيد رنگ جدول داده مسئله است بقيه جدول را بايد محاسبه كنيم )

عدد

                    فراواني

1

2

3

4

5

6

جمع

 

45

55

50

62

40

45

300

 

50

50

50

50

50

50

300

 

5/0

5/0

0

88/2

2

5/0

38/6

 اين تاس در صورتي سالم است كه داراي توزيع يكنواخت باشد . يعني فراواني تمام اعداد يكسان باشد .

1-    توزيع يكنواخت = 

مفروضات :

2-    تاس سالم است = توزيع داده‌ها يكنواخت است =

3-    تاس سالم نيست = توزيع داده‌ها يكنواخت نيست =

 تعداد طبقات =         تعداد پارامترهاي برآورد شده =                                  

 بنابراین فرض صفر مبنی بر یکنواخت بودن داده‌ها رد نمی­شود.