5- عواملی که موثر بر اندازه و تفسیر ضریب پیرسون می باشند.

در این فصل ما در باب عللی که ممکن است بر اندازه، و تفسیر پیرسون اثر بگذارند بحث می کنیم. این عوامل شامل شکل توزیع، اندازه نمونه، محدوده دامنه، تمرکز نمونه، پراکنش، شرایط بومی، خطای انداره گیری نمونه، و ارتباط با سه متغیر می باشند.

شکل توزیع:

در چند خط پیش ما ذکر کردیم که دامنه ممکن ضریب همبستگی از -1 شروع می شود و تا 1 ادامه می یابد. در این بخش، ما آن را مورد آزمایش قرار می دهیم. هر چند که فرض صفر ما برابر است با عدم تفاوت بین متغیرها و این مبحث نیز در فصل دو مورد بحث قرار گرفته شد. در مواقعی که شکل ایکس و وای به هم شبیه نباشند، ارزش ضریب همبستگی کمتر از 1 خواهد بود. و این دلیلی است که حداکثر ارزش ضریب همبستگی کمتر از 1 می باشد. شکل های توزیع یک شکل نمی باشند. و افزایش در ایکس همیشه به معنای افزایش در وای نمی باشد. و یا اینکه افزایش ایکس به معنای کاهش وای باشد. در نتیجه؛ حداکثر ضریب همبستگی که می توان در توزیع داشته باشیم کمتر از یک می باشد. و شباهت کمی بین این دو توزیع می باشد. خوانندگانی که تمایل دارند حداکثر ارزش را در شکل های مختلف توزیع محاسبه کنند باید به مقاله کارول صفحه 369 تا 370 رجوع کنند. با مقایسه کردن دو نمونه بالا،   می توان این را گفت که بالاترین ارزش ضریب همبستگی برابر مثبت 1 است اگر که دو طرف توزیع به سمت یک نمره گرایش داشته باشند. هر چند که، در چنین شرایطی بدست آوردن ضریب همبستگی منفی 1 غیر ممکن می باشد. زمانی که توزیع ایکس و وای شکل یکسانی دارند، ممکن است که با افزایش یکی دیگری نیز افزایش و با کاهش یکی دیگری نیز کاهش پیدا کند. نتیجتاً اینکه، می توان همبستگی کامل را در پژوهش در بعضی مواقع بدست آورد. در مقابل، افزایش یا کاهش در ایکس با افزایش و کاهش در وای همسان نیست. بنابراین، نمی توان همبستگی کامل را بدست آورد. مشابهاً می توان بالاترین ارزش در منفی1 را داشته باشیم ، و نمرات به سمت های مخالف یکدیگر جهت دهی داشته باشند. در مجموع، شکل های توزیع محدودیت های را برای ضریب همبستگی ایجاد می کنندو و باعث تحکیم دیگر عامل های می شوند.

اندازه نمونه:

اندازه ضریب همبستگی، دقت بالایی در تخمین همبستگی جامعه دارد. پارامتر جامعه به وسیله اندازه نمونه حساس می باشد. مخصوصاً زمانی که نمونه کوچک باشد. به یاد بیاورید که در فصل 2 گفته شد ضریب استاندارد خطا هنگامی که اندازه نمونه کوچک باشد افزایش می یابد. در نتیجه، همبسگتی نمونه ای که حجم آن کم باشد در تعیین همبستگی جامعه ضعیف عمل می کند. برای مثال، هنگامی که اندازه نمونه 20 نفر باشد و سطح معناداری 95% باشد ضریب همبستگی برابر 47/- و 47/ می باشد. هر چند که پی مساوی صفر باشد در مقابل، زمانی که اندازه نمونه 102 نفر باشد ضریب همبستگی با سطح معناداری بین 20/- و 20/  قرار می گیرد. طبق گفته ویشارد (1931). ارزش انتظار r2 وقتی که p=0، E(r2)  کارکردی از 1 تقسیم بر n-1 می باشد. برای مثال، e(r2)=1 زمانی اتفاق می افتد که دو موضوع در نمونه باشد. این مثال به صراحت نشان می دهد که دو چیز مهم هستند (x 1 . y1   ) و (x2.y2). به عبارت دیگر وقتی که اندازه نمونه کوچک باشد، ارزش انتظار r2  نسبتاً از صفر بزرگ تر است. خوانندگان باید به این موارد در هنگامی که ضریب همبستگی را بر اساس اندازه نمونه تفسیر می کنند دقت کنند.

داده های پرت:

داده های پرت ارزش های زیاد از حد در داده ها می باشند. که اثر مهمی بر ضریب همبستگی دارد. مخصوصاً زمانی که به نظر می رسد اندازه نمونه کوچک باشد.پراکنش ها می توانند در یکی یا هر دو متغیر دیده شوند. شکل 5 نمودار پراکندگی را با ضریب هبستگی 04/. بین متغیرها ی ایکس و وای را نشان می دهد، که تعداد افراد این مورد 27 نفر می باشد. کیس 27 در شکل 5-1 پرت می باشد.  و وقتی که این مورد حذف شود همبستگی بین کیس ها به 26/0 می رسد. اگر هر دو کیس 21 و 27 با یکدیگر حذف شوند، همبستگی به 37/0 ارتقاء پیدا می کند. چنانچه از این مثال بر می آید، داده های پرتی که در داده های دیگر فرض شده اند در نمونه های کوچک به آسانی بر ضریب همبستگی و جهت آن تاثیر می گذارد. در کل، زمانی که اندازه نمونه بزرگ باشد، کمتر از داده های پرت تاثیر می پذیرد.

 

محدوده دامنه:

همبستگی بین دو متغیر همچنین از محدوده دامنه نمرات یک متغیر یا متغیر دیگر یا هر دو متغیر تاثیر می پذیرد. نمرات شاید در محدوده معینی از یک طرف توزیع یا دو انتهای توزیع یا در وسط دامنه توزیع تجمع پیدا کند. دلایل زیادی برای اینکه نمرات محدود شوند وجود دارد. برای مثال، ابزارهای اندازه گیری به اندازه کافی دقیق نیستد تا خصیصه های متغیرها را دقیق اندازه بگیرند. علاوه بر این، افراد در کل به سوالاتی که حساسیت بالایی دارد مثل اینکه مواد مصرف می کنید یا الکل مصرف می کنید پاسخ مشخصی نمی دهند. بنابراین، توزیع ویژگی در جامعه درای کجی مثبت یا کجی منفی باشد. تحت شرایط مشخص، افراد به سوالات روان رنجورانه به طور یکسانی پاسخ نمی دهند. در نتیجه، عمده ای از پاسخ ها دراین مقیاس به سمت حد پایین توزیع کشانده می شود.مشابهاً بیشتر افراد ممکن است در مورد زندگیشان نظر مثبتی داشته باشند و عمده نمرات آنها در محدوده بالای پرسشنامه رضایت از زندگی تجمع گردد. محدوده دامنه همچنین زمانی اتفاق می افتد که محققان یک نمونه تقریبا متجانس را برای خود پژوهش خود انتخاب کنند. این نوع انتخاب در بعضی مواقع به انتخاب تصادفی باز می گردد. همگنی نمونه به این واقعیت بر می گردد که همه موضوعات ویژگی های مشترکی را در خود دارند. به عبارت دیگر، آنها به طور غیر مستقیم به سه متغیر محدود می شوند. و پژوهشگران بشتر علاقمند می شوند تا پیش زمینه این متغیرها را مقایسه کنند. برای مثال، اگر سه متغیر، در مباحث عمده ریاضی باشد، مرتبط با هوش و عمل حساب کردن می باشد. همبستگی بین هوش و عمل حساب کردن در نمونه بزرگ ریاضی تمایل دارند متفاوت باشند، به جای اینکه به صورت تصادفی باشند. اندازه همبستگی بر اساس ماهیت داده ها هم می تواند افزایش یابد و هم کاهش، هر چند که این تمایل وجود دارد که کاهش پیدا کند و این به خاطر آن است که داده ها در انتهای دامنه قرار دارد یا اینکه نمونه همگن می باشد. از طرف دیگر، محدوده دامنه خطای استاندارد را افزایش می دهد. و این باعث می شود که دقت تخمین جامعه کاهش پیدا کند. و این باعث می شود که خطای نوع دوم در ارتباط با فرض صفر افزایش پیدا کند. اگر فرض نرمال بودن توزیع را در نظر بگیریم. همبستگی بین متغیرهای ایکیس و وای تحت شرایط نامحدود را می توان به وسیله فرمول همبستگی زیر محاسبه کرد.


وقتی که r به عنوان همبستگی نمونه ای تحت شرایط نامحدوم محاسبه می شود. R  به عنوان همبستگی نمونه ای تحت شرایط محدود نامیده می شود. یک اندازه گیری با دامنه کاملی از نمرات پراکندگی زیادی را نسبت  به یک اندازه گیری با دامنه محدود که نمرات در پایین تر و بالاترین حد توزیع پراکندگی بیشتری را نشان می دهد. به خاطر اینکه واریانس بزرگتر از 1 می باشد و همبستگی در نمونه نا محدود تمایل به این دارد که بزرگ تر از همبستگی در نمونه محدود باشد و این گفته طبق فرمول به حساب می آید. نمودار پراکندگی در شکل 5-2  دامنه کامل نمرات برای 132 فرد پرخاشگر و عصابی و سوء گیر را نشان می دهد. ضریب همبستگی بین عصبانیت و پرخاشگری تقریبا برابر 50/0 می باشد و انحراف استاندارد عصبانیت برابر 52/6 می باشد. اگر 52 مورد از حد پایین عصبانیت را حذف کنیم، محدوده دامنه در پایین تر ین حد اتفاق می افتد.  انحراف استانداد آن برابر 32/4 می شود و این جریان در شکل 5-2b و نشان داده شده است. ضریب همبستگی بین عصبانیت و پرخاشگری به 23/0 تبدیل می شود. یک مورد مشهور در این باب همبستگی پایین بین GRE و GPA می باشد. این ارزش اغلب اشتباه برداشت می شود. به خاطر اینکه نمرات آزمون GRE و GPA در انتهای سطح بالای توزیع محدود شده است. با در دست داشتن نمرات پایین در GER و GPA اینکه آنها برای مطالعه پذیرفته نمی شوند رد می شود. بنابراین، همبستگی GRE و GPA معمولا کمتر از حد پیش بینی در نظر گرفته می شوند. نمونه عملی مشابه که اغلب در گزینه ها در مورد آن بحث می شود، انتخاب تست های شخصی برای پیش بینی عملکرد کارمندان می باشد. در عمل، یک یا بیش از یک آزمون معتبر فردی برای انتخاب تقاضاهای کاری انتخاب می شود. هر چند که همبستگی بین آزمون های انتخاب فردی و عملکرد شغلی در دامنه محدود گروهی برابر 3/0 می باشد اما همبستگی تخمین زده شده برای فرد  53/0 می باشد.

 

 

 

 

 

 

 

شکل5.2 (a) نمودار پراکندگی برای عصبانیت و پرخاشگری بدون دامنه محدودیت.(b) نمودار پراکندگی برای عصبانیت  و پرخاشگری با دامنه محدودیت در حد پایین. (c) نمودار پراکندگی برای عصبانیت و پرخاشگری با دامنه محدودیت در حد وسط.

با بازگشت به مثال قبلی، اگر 54 فردی که در سطح متوسط عصبانیت حذف شوند، محدوده دامنه در حد متوسط دامنه اتفاق می افتد. چنانچه در شکل 2-5 قسمتc نشان داده شده است، ضریب همبستگی بین عصبانیت و پرخاشگری در این محدوده معمولاً بالای 63/0 می رود. با حذف نمرات حد وسط، تفاوت در محدوده نمرات معمولاً افزایش پیدا می کند. آن را با  نمرات کامل دامنه مقایسه کنید. بنابراین، اندازه همبستگی در اندازه محدود احتمالاً بزرگتر از اندازه نامحدود است. از دیگر موارد مشکل سازی که می تواند اتفاق بیفتد، طرح گروههای مزدوج می باشد. برای مثال، سیاست های پژوهشی محققان حکم می کند که اگر بین نگرش در باب امنیت اجتماعی و رفتار بخشندگی ارتباطی وجود دارد: اولاً؛ محقق افرادی را به عنوان نمونه انتخاب کرده است که نگرش های مثبت یا منفی در باب سیستم امنیت اجتماعی دارند. در نتیجه؛ محقق همبستگی مثبتی بین رفتار بخشودگی و نگرش ها گزارش می کند. طرح گروههای مزدوج قدرت آماری بالایی را فراهمی می کند. بالا رفتن نتیجه مورد نظر در یافته ها به خاطر وجود طرح های است که افرادی را با نگرش های مختلف در بر می گیرد. نتیجتاً، این به محققین کمک می کند تا ارتباط نیرومند بین رفتار بخشودگی و نگرش را پیدا کند. حتی اگر اندازه ارتباط کوچک باشد.

در نظر بگیرید که اگر انحراف استاندارد نگرش در گروهی 10 باشد و در طرح گروههای مزدوج سازمان دهی شده باشد، و 5 در گروه نامحدود در دامنه. پس طبق فرمول همبستگی همبستگی بین نگرش و دفتار بخشودگی در گروه نامحدود 28/0 تخمین زده می شود.