آزمون خی دو
آزمون كایدو()
توزیع کای دو
آزمون کای دو یک آزمون ناپارامتریك است كه توسط فیشر ارائه شده و كار اصلی آن، بررسی معناداری تفاوت بین فراوانیهای مشاهده شده و مورد انتظار است . فرمول كلی كایدو به شكل زیر میباشد.
فراوانی مشاهده شده
: فراوانی مورد انتظار
توزیع كایدو از توزیع نرمال بدست میآید. اگر متغیر x متعلق به جامعه نرمال با میانگین و انحراف معیار باشد و از این جامعه نمونه تصادفی به حجم n انتخاب شود، سپس هریك از اعضای نمونه با استفاده از فرمول z= استاندارد شوند، متغیر تصادفی زیراز توزیع کایدو با n درجه آزادی پیروی میكند.
توزیع كای دو دارای رابطه ای به شكل زیر می باشد كه در آن k در جه آزادی را نشان میدهد و میانگین و وایانس آن به ترتیب k و2k میباشد.
F(x)=***
نحوه عملكرد آزمون كای دو
جمعآوری اطلاعات، مقداری را برای فراوانی در سلولها نشان میدهد. به این فراوانیها، فراوانی مشاهده شده گویند. از طرفی در صورتی كه طبق فرض صفر استقلال بین دو متغیر وجود داشته باشد، انتظار داریم فراوانیها به شكل دیگری باشد. طبیعی است كه بین این دو نوع فراوانی اختلاف وجود داشته باشد. در صورتی كه اختلاف قابل توجه نباشد، میتوانیم فرض مورد نظر را بپذیریم.
در غیر این صورت فرض صفر رد می شود. علت تقسیم كسر( بر نرمالایز كردن یا بیمقیاس كردن دادههاست.
شرایط استفاده از آزمون كای دو
1- تصادفی بودن دادهها
2-مستقل بودن نمونهها
3-بزرگ بودن نمونه به اندازه كافی
گفته می شود فراوانی سلولها نباید كمتر از 10(به عقیده بعضیها 5) باشد. در صورتی كه این اتفاق بیافتد باید طبقات ادغام شود. به همین دلیل بعضی از محققین اعتقاد دارند برای انجام آزمون كایدو تعداد نمونهای بزرگتر از 50 مورد نیاز است. در نرم افزار spss در صورت وجود سلولهایی با فراوانی كمتر از 5 به مقدار بیش از 20% سلولها هشدار داده می شود، این بدین معنیست كه تست كایدو، قدرت لازم را جهت انجام آزمون ندارد.
4-آزمون كای دو برای متغیرهای رتبهای و اسمی استفاده میشود.
مراحل آزمون كای دو
1-فراوانی های مورد انتظار را با استفاده از توزیع مورد آزمون تعیین كنید.
2-آماره را تعیین كنید.
3- مقدار بحرانی را از جدول كایدو با سطح خطای مورد نظر و درجه آزادی N-K-1 محاسبه نمایید. که در آن N تعداد طبقات و K تعداد متغیرهای برآورد شده میباشد.
4- تصمیم گیری كنید.
آزمون نیکویی برازش، ميزان تناسب و ارزش يكسري از دادهها را با يك توزيع خاص مثل توزيع نرمال يا پواسون بررسي مي كند. در صورتيكه دادهها از شكل توزيع فاصله زيادي نداشته باشند برازش دادهها با آن توزيع تعيين و در غير اين صورت رد ميشود. روش آزمون در اين جا نيز مانند 2 كاربرد دیگر آزمون کایدو است بدين معنا كه با محاسبه مقادير فراواني مورد انتظار اين مقادير در قالب رابطه توزيع با فراوانيهاي واقعي يا مشاهده شده مقايسه ميشود و در نهايت با مقايسه آماره حاصل با حدود بحراني برازش دادهها مشخص ميشود .
مثـال : فرض كنيد براي بررسي سالم بودن يك تاس 300 بار آن را پرتاب كرده كه توزيع نتايج اين 300 بار بين اعداد 1 تا 6 به صورت جدول زير است . (فقط قسمت سفيد رنگ جدول داده مسئله است بقيه جدول را بايد محاسبه كنيم )
عدد فراواني |
1 |
2 |
3 |
4 |
5 |
6 |
جمع |
45 |
55 |
50 |
62 |
40 |
45 |
300 |
|
50 |
50 |
50 |
50 |
50 |
50 |
300 |
|
5/0 |
5/0 |
0 |
88/2 |
2 |
5/0 |
38/6 |
اين تاس در صورتي سالم است كه داراي توزيع يكنواخت باشد . يعني فراواني تمام اعداد يكسان باشد .
1- توزيع يكنواخت =
مفروضات :
2- تاس سالم است = توزيع دادهها يكنواخت است =
3- تاس سالم نيست = توزيع دادهها يكنواخت نيست =
تعداد طبقات = تعداد پارامترهاي برآورد شده =
بنابراین فرض صفر مبنی بر یکنواخت بودن دادهها رد نمیشود.