تحلیل داده های شبکه ای، مدلبندی آماری و نرم افزار

"ما در جهان شبکه ای زندگی می کنیم" جمله ای تکراری که به خوبی توصیف کننده ی جهانی (imaginary بعد ) است که در آن زندگی می کنیم و دلیلی برای علاقمندی به علم شبکه در سال های اخیر. نقش شبکه های اجتماعی و اینترنت و شیوه ی تعامل افراد با یکدیگر در این گرایش را نمی توان نادیده گرفت. شبکه در فرهنگ لغت اکسفورد به صورت مجموعه ای از اشیاء مرتبط با هم تعریف شده است. موضوع دیگر گرایش به این حوزه ی دانشی، تحلیل و مدلسازی سیستم های پیچیده است. یکی از پیچیده ترین سیستم های موجود در عالم امکان، سیستم روانی انسان ها است اگر چه این پیچیدگی ناممکن بودن مدلبندی رو نیز تحت شعاع خود قرار می دهد اما حداقل در حوزه ی رفتارشناسی انسان ها به صورت جزء قابل کاربست است. وقتی مسئله ی مطالعه و تحلیل رفتار انسانی موضوع مطالعه ی چنین دسیپلینی می باشد، مشخص است که در مورد شاخه های ساده تر مانند الکترونیک، برق، مهندسی های مختلف، اقتصاد، پزشکی، زیست شناسی، گیاه شناسی، کشاورزی، زمین شناسی، فیزیک و ... بسیار کاربرد پذیرتر و مطالعات آن دارای راندمان بیشتر است. علم شبکه مانع کاهش گرایی می شود که ویژگی اصلی قرن گذشته است و تسهیل کننده ی خوبی برای مدیریت، ذخیره و جمع آوری داده های با توان بالا است.

یکی از مسائل مهم در علم شبکه ایجاد گزاره های خبری مبتنی بر علم آمار است. به عبارت مبانی علم آمار در ایجاد گزاره های خبری بکار گرفته می شوند. منظور از گزاره ی خبری همان استخراج نتایج استنباطی از داده ها است. با این وجود در مدلسازی شبکه دو کلاس مدلبندی مختلف وجود دارد مدل بندی یا مدلسازی ریاضیاتی و مدلسازی آماری. در مدلسازی ریاضیاتی از قواعد احتمالاتی برای تصویر کردن شبکه استفاده می شود تا یک مکانیسم خاص یا فرضیه ی مشخص بررسی شو و در مدل سازی آماری یک مدل خاص آماری با داده های تجربی بدست آمده برازش داده می شود تا مشخص شود آیا داده ها با مدل برازش دارند یا خیر. در ادبیات مدلبندی آماری مدل های مختلفی وجود دارد به عنوان مثال مدل های گراف تصادفی توانی که با مدل های خطی تعمیم یافته همتا هستند بر مبنای شکلی از خانواده ی توانی اند. به طور مشابه مدل های شبکه ی پنهان در پیدا کردن یال هایی که ممکن است حداقل در بخشی از یک متغیر یا متغییرهای اندازه گیری نشده و ناشناخته، نقش دارند. این متغییرهای پنهان در عمل مثل استفاده متغییرهای پنهان در مدل های آمیخته است. مدل های بلوکی تصادفی ممکن است به عنوان شکلی از مدل های آمیخته محسوب شوند. با این وجود  مشخصات و ویژگی های این مدل ها و شرایط برازش آنها چندان فرم استانداردی ندارد و به ماهیت بعد بالای داده ها و ماهیت وابسته ی آنها بر می گردد. نکته ی دیگر داینامیک بودن ذاتی شبکه ها است به عبارتی در واقعیت شبکه ها در حال تغییرند تا در حال ثبات. مثلا شبکه ی بیماری کرونا را می توان در نظر گرفت که هر روز وضعیت آن متفاوت می شود. روش های مدل سازی ریاضیاتی و آماری غیر از شبکه ناتوان در مطالعه ی چنین رویدادهایی هستند یا ابزار انها بسیار اولیه است اما استفاده از مدل های شبکه ای آماری در حال حاضر بسیار زیاد است.

چرا باید از نرم افزار آر R در مدل بندی شبکه استفاده شود؟

ابزارهای گوناگونی برای تحلیل شبکه در دسترس هستند. بعضی از این ابزار تنها مبتنی بر ویندوزند مانند پژک (پجک Pajek) یا مبتنی بر زبان جاوا هستند مانند گیفی Gephi سایر دیگر نرم افزارها درون محیط برنامه نویسی قرار می گیرند. مثالهایی از این بسته ها را می توان به بسته ی NetworkX در پایتون و igraph در محیط R.

توسعه ی برنامه های آمار در حال حاضر در زبان آر به شدت بیشتر از سایر زبان ها است این موضوع در مورد تحلیل داده های شبکه ای هم صادق است. بسته های مختلف آماری و الگوهای مختلفی برای تحلیل های شبکه و تغییر و دستکاری و شبیه سازی در آر برنامه نویسی شده است. به لحاظ گرافیکی نیز این نرم افزار یک نرم افزا قوی محسوب می شود. تعداد بسته های نرم افزاری آر به صورت تصاعدی در حال افزایش است. آی گرف یکی از بسته های تحلیل گراف در آر است در حالی که بسته های مختلف دیگری نیز با اهداف مختلف برنامه نویسی شده است. به عنوان مثال کیو گراف qgraph یک بسته با کاربردهای روانسنجی علم شبکه است یا بسته های مختلف دیگر که در زبانشناسی و تحلیل وب استفاده می شود.

برگفته از کولازیک 2014

روش های آماری علوم اعصاب، تحلیل داده های علم مغز

روش های آماری علوم اعصاب، تحلیل داده های علم مغز

علوم وابسته ی به مغز به دنبال این موضوع هستند تا دریابند که فعالیت نرون ها چگونه است؟ افکار چگونه پدید می آیند و رفتار چگونه ساخته می شود؟ چه چیزی سبب می شود که ما به عنوان یک انسان بتوانیم بشنویم، ببینیم، احساس کنیم، رفتار کنیم؟ چه چیزی سبب خشم، عشق، نفرت و یا بیماری های روانی می شود؟ اساس حافظه چیست؟ چگونه تصمیم می گیریم؟ چگونه روی یک موضوع تمرکز می کنیم؟ و ... . پاسخ به چنین سوالاتی نیازمند اشتیاق و جسارت فراوان می باشد.اگر چه کار روی سیستم های عصبی از پیچیدگی بالایی برخوردار است؛ اما بعضی از حوزه های دانشی پیشرفت های فراوانی داشته اند. بعضی از حوزه ها مانند: انتقالات بین سیناپسی، پردازش حسی، پایه های زیست شیمیایی حافظه و کنترل حرکتی کشف شده اند. این پیشرفت ها پایه های علوم اعصاب مدرن را تشکیل می دهند و توانسته اند روی حوزه های بالینی نیز تاثیر داشته باشند. روش شناسی که بر اساس آن چنین داده هایی بدست می آید هم مشاهده است و هم روش های آزمایشی. اما یکی از مهمترین پایه های روش شناسی آن ملاحظات دقیق روی داده هایی است که از سیستم عصبی بدست می آید. گاهی اوقات نتایج بدست آمده کاملا کیفی و گاهی کاملا کمی است. امروزه پژوهش در حوزه ی مغز در برگیرنده ی تکنیک های مدرن گوناگونی است که روش هایی مانند روش های مولکولی، گزارش‏گیری Patch clamp، تصویر برداری دو فوتونی، مطالعات تک الکترودی و چند الکترودی، توانمندی های زمینه محلی، تصویربرداری اختیاری، الکتروآنسفالوگرافی، PET، fMRI، MEG و همچنین مطالعات رفتاری و سایکوفیزیکال است. تمام این روش ها به بهبود ذخیره سازی داده ها، دستکاری و تکنولوژی های ارائه ی آنها و همچنین پیشرفت تکنیک های تحلیلی کمک می کند. به عنوان مثال مجموعه داده های بدست آمده در شرایط کنونی نسبت به شرایط پیشین زیادتر و پیچیده ترند. برای دانشجویان حاضر علوم اعصاب و رفتار دانش کاری روش های اساسی تحلیل داده ها غیر قابل اجتناب است. 

کاربرد تحلیل داده های شبکه ای محتوای شبکه های اجتماعی موبایلی، به منظور سنجش ویژگی های  شخصیتی، توان

نویسنده و مسول مقاله: محمد حسین ضرغامی (دکتری سنجش و اندازه گیری)

یکی از مهمترین موانع جدی تصمیم گیری برای کسانی که لازم است دست به قضاوت و ارزشیابی بزنند- مثلا روانشناسان، مشاوران، مدیران و غیره- اطلاعاتی است که عموما از طریق روش های خودگزارش دهی[1] جمع آوری می‏ شوند. روش های خودگزارش دهی عمدتا از طریق مصاحبه، پرسشنامه، چک لیست و یا مشاهده صورت می پذیرند. به نظر می رسد استفاده از داده های فیزیولوژیکی مانند نتایج بدست آمده از EEG، MRI، FMRI، Eye tracking و ... بتواند بر بعضی از مشکلات ناشی از روش های خودگزارش دهی فائق آید. با این وجود استفاده از این روش ها علاوه بر این که نیازمند ابزار و هزینه های خاص است، میزان موفقیت آنها در بیشتر مقالات گزارش شده، تفاوت معناداری با نتایج بدست آمده از روش های خودگزارش دهی ندارد. شایان ذکر است که مساله ی اعتباریابی این روش ها، به همان اندازه‏ ی روش های خودگزارشی سوال برانگیز است.

ظهور شبکه های اجتماعی آنلاین[2] یکی از حوزه های پر هیجان دهه‏ ی اخیر مخصوصا در روابط اجتماعی به شمار می رود. شبکه های اجتماعی موبایل مانند وایبر[3]، تلگرام[4]، واتس اپ[5]، تانگو و سایر شبکه های اجتماعی در بین کاربران به سرعت محبوب شده اند. چنین شبکه هایی به لحاظ محتوایی فوق العاده غنی اند و حجم بسیار بالایی از محتوا و داده های ارتباطی را در بر می گیرند که برای دستیابی به اهداف مختلف مورد تحلیل قرار می گیرند. امروزه داده های چنین شبکه هایی به عنوان طلای سیاه در نظر گرفته می شوند(هان و کامبر، 2011).

 

 

 

 

 

 

ساختار اطلاعات[6] موجود در شبکه های اجتماعی با مولفه های نظریه گراف[7] همخوان است. دو مولفه ی اساسی تئوری گراف، رآس[8]  و یال[9] است. راس یا گره در شبکه های اجتماعی متون، تصاویر و سایر چند رسانه‏ای‏ها است و یال یا ارتباط بین رئوس، ویژگی یا چیزی است که به عنوان رابط بین گره ها در نظر گرفته می شود. غنای چنین شبکه هایی فرصت های بی سابقه ای را برای تحلیل‏گران داده در حوزه های مختلف، از فلسفه تا علم[10] فراهم می آورد.

 

 

 

 

 

 

 

شبکه اجتماعی می تواند بر اساس اهداف مختلف به شیوه های گوناگون تعریف شود. به عنوان مثال یک گروه دوستی می تواند به عنوان یک شبکه ی اجتماعی مقصود اصلی مطالعه باشد. البته پر واضح است که اگر صرف ارتباط، مورد نظر باشد؛ هر گروه دوستی در شبکه های اجتماعی موبایل، در برگیرنده ی تمام افراد جهان می شود که برنامه ی مربوط به آن شبکه را روی موبایل خود نصب کرده و از آن استفاده می کند. از این منظر شما خواننده عضو تمام گروههای دوستی موجود در جهان می باشید و در صورت فائق آمدن بر موانع سخت افزاری و نرم افزاری می توانید ارتباط دلخواهتان را برقرار نمایید. به لحاظ نظری و تجربی این موضوع سال ها قبل از پیدایش موبایل و اینترنت توسط میلگرام در مقاله ای با عنوان جهان کوچک[11] مطرح و به لحاظ تجربی ثابت شده است(https://en.wikipedia.org/wiki/Small-world_experiment). بنابراین تعیین حد و مرز و تعریف شبکه ی مورد مطالعه بسیار اهمیت دارد و این مهم، از طریق الگوریتم های مبتنی بر مدل های آماری گراف و داده های شبکه ای[12] امکان پذیر است.

شخصيت را شايد بتوان اساسی ترين موضوع علم روان شناسی دانست؛ زيرا محور اساسی بحث در زمينه هايی مانند يادگيری، انگيزش، ادراک، تفکر، عواطف و احساسات، هوش و مواردی از اين قبيل است. از طرف ديگــر، در مطالعــه ی بيماری هــای روانی کنشی، مانند انواع ســايکوزهای کنشی، اختلالات شخصيت و منش، تمام نوروزها، رفتارهای ضد اجتماعــی و ضد اخلاقی، اعتياد و انحراف ها، شخصيت نقش محوری و اساسی دارد. در رابطه با جايگاه و اهميت شخصيت در روان شناسی، گفته شده است که شخصيت مانند ديگی است که همه ی مخلفات روان شناسی در آن پخته می شود (شاملو، ۱۳۷۷). از این رو سنجش ویژگی های شخصیتی و توانمندی های هوشی در حوزه ی منابع انسانی[13] و روانشناسی غیر قابل انکار است به طوری که بخش عظیمی از فعالیت ها و تلاش های روانسنجان در گذشته و در زمان حال را به خود اختصاص داده است.

 

 

 

 

 

 

تشخیص بالینی مهمترین و پایه ‏ای ترین گام درمان به شمار می رود که توسط روانشناسان و روانپزشکان و عمدتا بر اساس نشانگان بالینی مراجع صورت می پذیرد. با وجود آموزش های مختلفی که این متخصصان دریافت می کنند، تشخیص های بالینی می تواند از سوگیری های فردی[14]، فرافکنی شخصی[15]، اثر معیار سرایت، اثر هاله ای[16]، نقاب های اجتماعی[17] و سایر عوامل مختل کننده که ناشی از ارتباط بین فردی[18] است؛ متاثر شود. علاوه بر این فرد می تواند در خود اظهاری به خاطر مجموعه‏ ی کلانی از عوامل فردی و اجتماعی در روند تشخیص و درمان اختلال ایجاد نماید. در کنار تجارب و پیشینه ی مراجع و درمانگر، کلیه ‏ی مولفه های فضا-زمان[19] و تعاملات بین آنها نقش تعیین کننده ای در فرآیند تشخیص، درمان و درمان پذیری دارد.

به کارگیری و استفاده از شیوه های سنجش غیر مستقیم[20] در تشخیص بیماری های روانی و یا برآورد ویژگی های شخصیتی افراد بسیار ضروری است. استفاده از روش های کشف دانش[21] مبتنی بر شبکه ‏های اجتماعی (مانند شبکه های اجتماعی موبایل) می تواند در خدمت کسانی باشد که هدف آنها سنجش ویژگی های شخصیتی، توانمندی های هوشی و تشخیص بیماری های روانی است. خود ابرازگری افراد در این روش ها نسبت به موارد گفته شده بیشتر است، موانع اجتماعی به حداقل رسیده و شبکه ی ارتباطی فرد، امکان اعتباریابی تشخیص ها را فراهم می آورد. بنابراین از نگاه درمانی علاوه بر فرد، شبکه ی بسیار وسیعی از جهان ارتباطی وی و دیتای قابل توجهی از محتوای کلام در قالب نشانه –متن و تصویر و سایر ابزار چند رسانه ای- در دسترس است که می تواند شخصیت، توانمندی های شناختی و غربالگری روانی را به صورت غیر مستقیم سنجش نماید و درمان را به لحاظ ساختاری، به صورت همزمان، فردی و گروهی نماید.

 

  1.  شاملو، سعید، «مکتب ها و نظریه ها در روانشناسی شخصیّت»، تهران، رشد، انتشارات رشد، 1390.

Han, J., Kamber, M., & Pei, J. (2011). Data mining: concepts and techniques: concepts and techniques. Elsevier.



[1]. Self-report

[2]. Online social networks

[3]. viber

[4]. telegram

[5]. What’s up

[6]. Information structure

[7]. Graph theory

[8]. node

[9]. edge

[10]. science

[11]. the small world

[13]. Human Rescores

[14]. Individual biases

[15]. Personal projection

[16]. Halo effect

[17]. Social persona

[18]. Intra individual

[19]. time-space components

[20]. Indirect assessment

[21]. Knowledge discovery

تحليل عاملي 1

تحلیل عاملی یکی از فنون پیشرفته امار چند متغیری است که در جهت دستیابی به بسیاری از هدفهای علمی و پژوهشی مانند مدلسازی ،فرضیه سازی،رواسازی تست ها،تشخیص پاره تست ها، وفراهم ساختن زمینه اجرای سایر روشهای پیشرفته اماری مانند رگرسیون چند متغیری و معادلات ساختاری به کار می رود.اما پیچیدگی و دشواری درک ،اجرا تفسیر نتایج تحلیل عاملی موجب شده است بسیاری از کاربران بدون اشنایی با منطق زیر بنایی ،محدودیتها ونیز دامنه کاربرد آن ،به اجرا و بکارگیری یافته های حاصل از ان بپردازند و بدین ترتیب زمینه ساز تفسیر های نامعتبر و ناروا ونیز تعمیم های نادرست از پدیده ها ومتغیرهای مورد مطالعه گردند. تحقیق حاضر، به معرفی این تکنیک، کاربردها و روشهای پیاده سازی آن می پردازد.

2.  مقدمه

نخستين كار درباره تحليل عاملي، توسط چارلز اسپيرمن (1940) صورت گرفت، كه به گونه كلي « پدر» اين روش شناخته شده است. بعد از او كارل پيرسن)1901(، روش «محورهاي اصلي» را پيشنهاد كرد و هتلينگ (1933) آن را به گونه كاملتري توسعه داد.

بسياري از كارهاي نخستين در تحليل عاملي، يعني در طول سال هاي 1900 تا 1930، به كاربرد مدل اسپيرمن در بسياري از مسايل عملي و بررسي شرايط مناسب براي استفاده از آن مدل اختصاص يافته است. در طول اين دوره، علاوه بر خود اسپيرمن، دانشمندان ديگري مانند سيريل برت، كارل هليزينگر، ترومن كلي، كارل پيرسن و گادفري تامسون، كمك هاي شاياني به ادبيات تحليل عاملي كرده اند. در اوايل سال 1930، آشكار شد كه مدل تك عاملي عمومي اسپيرمن براي توصيف روابط بين متغيرهاي يك مجموعه هميشه كافي نيست.

ترستون احتمالا برجسته ترين تحليلگر عاملي نوين بوده و نفوذ قابل ملاحظه اي در توسعه اين روش از سال هاي 1930 تا كنون داشته است. مسئوليت توسعه روش «سانتروئيد» با اوست كه در مقياس گسترده اي قبل از ظهور كامپيوترهاي پر سرعت به كار رفته است. او همچنين مسئول مفهوم ساختار ساده است كه توسط بيشتر تحليلگران به عنوان معرف يك راه حل تحليل عاملي ايده آل در نظر گرفته شده است.

كارهاي اوليه در تحليل عاملي  كه توسط دانشمندان ياد شده انجام گرفته ، بيشتر توجيه نظري دارد، هر چند هيچ يك از آن ها آماده براي آزمون هاي آماري فرضيه هاي خاص درباره ساختارهاي عاملي مجموعه هاي معيني از متغيرها نبوده است. اما، وقتي كامپيوترهاي پر سرعت در اختيار قرار گرفت در اواسط تا اواخر سال هاي 1950، حركتي از تئوري گرائي به سوي آنچه تحليل عاملي اكتشافي ناميده مي شود، به وجود آمد. اين حركت به گونه آشكار از طريق تئوري عامل مشترك ترستون تشويق، و از طريق فرمول بندي عمومي هتلينگ (1993)، درباره عمليات رياضي مولفه هاي اصلي كه قبل از آن به دليل محاسبات فوق العاده پيچيده و پرزحمت آن ، به كار نرفته بود تسهيل شد. چنين به نظر مي رسد كه در طول سال هاي 1950 و 1960، تقريبا هر كس، هر چيزي را تحليل عاملي مي كرده است، به اين اميد كه روابط پيچيده ظاهري بين متغيرهاي يك مجموعه را مي توان ساده كرد و به گونه ساده تري تفسير نمود (ليندمن و همكاران، 1980). در طول اين دوره همچنين تعداد روشهاي تحليل عاملي با ابداع تحليل تصوير (گاتمن، 1953)، تحليل عاملي بنيادي (رائو، 1955) و (هريس،1962)، تحليل عاملي آلفا (كيسر و كافري، 1965) و روش كمترين پس ماند (هامن و جونز، 1966)، به گونه قابل توجهي توسعه يافت. با اين وجود، روشهاي تحليل اكتشافي نتوانست آن گونه كه انتظار مي رفت، كمك موثري براي آزمون و پالايش تئوري روان شناختي باشد. 

مقاله هتلينگ (1933) درباره تحليل مولفه هاي اصلي نخستين كمك قابل توجه يك آماردان را به تحليل عاملي معرفي كرد، و اين وضعيت تا موقعي ادامه داشت كه مقاله لاولي (1940) درباره روش بيشينه احتمال (ML) منتشر شد. لاولي نشان داد كه تحليل عاملي مي تواند به عنوان يك تكنيك آماري جالب در بسياري از موقعيت هاي پژوهشي كاربرد داشته باشد. واكنش هاي له و عليه اين روشها نيز تا وقتي كه آزمون فرضيه هاي خاص درباره پارامترهاي مدل تحليل عاملي مورد توجه قرار گرفت (مثلا جارزكاگ، 1984)، همچنان ادامه داشت. هر چند كارهاي جارزكاگ اساسا مبتني بر روش ML لاولي بود، اما بسياري از مسايل محاسباتي و تفسيري را كه لاولي با آن مرتبط نبود، روشهاي باك و بارگمن (1966) و جارزكاگ (1984) به سبب تاكيد بر آزمون فرضيه، به عنوان روشهاي تحليل عاملي تاييدي طبقه بندي مي شود. هر چند توليد فرضيه هايي كه بايد آزمون شود اغلب دشوار است، اما اين روشها به وضوح بر تحليل عامل اكتشافي به سبب توسعه و آزمون تئوري مزيت دارد. البته براي تدوين چنين فرضيه هايي مي توان ابتدا تحليل عاملي اكتشافي را اجرا كرد و سپس اين فرضيه ها را از طريق تحليل عاملي تاييدي آزمود.


مدل فازي سوال پاسخ1

مدل فازي سوال پاسخ: 
هدفي كه در اين ارائه دنبال مي شود، معرفي و شناسايي يك رويكرد جديد به نام مدل فازي سوال پاسخ(Fuzzy item response model) است. در اين رويكرد، نظريه ي سوال پاسخ با نظريه ي مجموعه هاي فازي تركيب مي شود. اين مدل مربوط به حوزه ي سنجش و اندازه گيري است. بعد از معرفي اين مدل مثالي از كاربردي شدن اين مدل توسط وو و چي يو زده مي شود و اين مثال توضيح داده مي شود.
در نظريه ي كلاسيك اندازه گيري روشي وجود دارد به نام"روش جمع متوالي(Successive Integral)" ، يا روش "نمرات خام". اين روش در حوزه ي نمره گذاري در اندازه گيري روانشناختي  مورد توجه است. در اين روش گزينه هاي مربوط به يك گزاره يا سوال داراي فواصل برابر در نظر گرفته مي شوند و پشت سرهم جمع بسته مي شوند. به عنوان مثال 1 و 2 و ... به گزينه هاي كاملا موافقم، موافقم و .... داده مي شود. اين روش بسيار ساده است و از روش هاي محبوب و فراگير در اندازه گيري روانشناسي قلمداد مي شود. اين روش مورد انتقادات زيادي قرار گرفته است. مفروضه ي برابري گزينه هاي مجاور، سوال برانگيز است. دوم اين كه مقياس رتبه دهي ماهيتا زباني است تا عددي. بنابراين كاربرد نظريه ي فازي در اين مورد پذيرفتني و قابل دفاع است و جايگزين بسيار شايسته اي براي روش نمرات خام محسوب مي شود. 
استفاده از تابع عضويت از اين جهت كه سبب كاربرد مجموعه هاي فازي در حوزه ي اندازه گيري علوم انساني مي شود، بسيار حائز اهميت است. در مهندسي و علوم روش هاي تعريف و ساخت تابع عضويت فراوان است. بعضي از اين روش ها عبارتند از روش هاي شهودي، انتقال احتمالات به فضاي امكان، هيستوگرام ها، نزديكترين همسايگي، شبكه هاي عصبي پسخوراند، خوشه بندي، تجزيه ي آميخته. با اين وجود در اندازه گيري روانشناختي روش هاي بكارگرفته شده و استخراج شده كم اند. بعضي از مطالعات رويكرد فازي را در كنار نظريه ي كلاسيك استفاده كرده اند و به مجموعه هاي پاياتر و صحيح تر از نمرات خام دست يافته اند. استفاده از اين رويكرد قوي در نظريه هاي صفت مكنون نيز به اندازه گيري و سنجش صحيح تر و درست تر نائل مي شود. در CTT نمرات خام پايه ي اصلي است. براي دستيابي به اندازه گيري معنادار، اندازه گيري بايد تك بعد، خطي، بدون تعبير و عيني باشد. نمره ي خام داراي اين ويژگي ها نيست. مشخص است كه IRT نسبت به نظريه كلاسيك ارجح است در اين رويكرد نياز به خطي بودن وجود ندارد و نمرات وابسته ي به نمونه سوالات يا نمونه افراد نيست. 
كاربرد مجموعه هاي فازي در يك مثال: مدل PCM يك مدل تك بعد براي سوالات چند بخشي است. اين مدل دشواري يك سري از طبقات كه به آنها گام مي گويند، را پامتري مي كند. يكي از ويژگي هاي اين روش اين است كه امكان تغيير گام در بين سوالات آن وجود دارد و اين ويژگي اي متمايز كننده ي براي آن محسوب مي شود. مدل PCM عضوي از خانواده ي مدل هاي خصيصه مكنون  راش محسوب مي شود كه داراي دو ويژگي عينيت خاص (Objective Specificity) در مقايسه ي سوالات و افراد و قدرت تفكيك پارامتر(Parameter separability) را دارا است. 
در اين ارائه مي خواهيم نحوه ي كاربرد نظريه ي فازي در مدل PCM را شرح داده تا از اين راه اعداد فازي بسازيم و اين اعداد فازي را در اندازه گيري روانشناسي به كار ببريم و يك مثال تجربي انجام شده را ذكر كنيم. 
براي درك بهتر بايد روش PCM توضيح داده شود و سپس نحوه ي ساخت اعداد فازي ذكر شود. 

مدل فازي سوال پاسخ1

مدل فازي سوال پاسخ: 
هدفي كه در اين ارائه دنبال مي شود، معرفي و شناسايي يك رويكرد جديد به نام مدل فازي سوال پاسخ(Fuzzy item response model) است. در اين رويكرد، نظريه ي سوال پاسخ با نظريه ي مجموعه هاي فازي تركيب مي شود. اين مدل مربوط به حوزه ي سنجش و اندازه گيري است. بعد از معرفي اين مدل مثالي از كاربردي شدن اين مدل توسط وو و چي يو زده مي شود و اين مثال توضيح داده مي شود.
در نظريه ي كلاسيك اندازه گيري روشي وجود دارد به نام"روش جمع متوالي(Successive Integral)" ، يا روش "نمرات خام". اين روش در حوزه ي نمره گذاري در اندازه گيري روانشناختي  مورد توجه است. در اين روش گزينه هاي مربوط به يك گزاره يا سوال داراي فواصل برابر در نظر گرفته مي شوند و پشت سرهم جمع بسته مي شوند. به عنوان مثال 1 و 2 و ... به گزينه هاي كاملا موافقم، موافقم و .... داده مي شود. اين روش بسيار ساده است و از روش هاي محبوب و فراگير در اندازه گيري روانشناسي قلمداد مي شود. اين روش مورد انتقادات زيادي قرار گرفته است. مفروضه ي برابري گزينه هاي مجاور، سوال برانگيز است. دوم اين كه مقياس رتبه دهي ماهيتا زباني است تا عددي. بنابراين كاربرد نظريه ي فازي در اين مورد پذيرفتني و قابل دفاع است و جايگزين بسيار شايسته اي براي روش نمرات خام محسوب مي شود. 
استفاده از تابع عضويت از اين جهت كه سبب كاربرد مجموعه هاي فازي در حوزه ي اندازه گيري علوم انساني مي شود، بسيار حائز اهميت است. در مهندسي و علوم روش هاي تعريف و ساخت تابع عضويت فراوان است. بعضي از اين روش ها عبارتند از روش هاي شهودي، انتقال احتمالات به فضاي امكان، هيستوگرام ها، نزديكترين همسايگي، شبكه هاي عصبي پسخوراند، خوشه بندي، تجزيه ي آميخته. با اين وجود در اندازه گيري روانشناختي روش هاي بكارگرفته شده و استخراج شده كم اند. بعضي از مطالعات رويكرد فازي را در كنار نظريه ي كلاسيك استفاده كرده اند و به مجموعه هاي پاياتر و صحيح تر از نمرات خام دست يافته اند. استفاده از اين رويكرد قوي در نظريه هاي صفت مكنون نيز به اندازه گيري و سنجش صحيح تر و درست تر نائل مي شود. در CTT نمرات خام پايه ي اصلي است. براي دستيابي به اندازه گيري معنادار، اندازه گيري بايد تك بعد، خطي، بدون تعبير و عيني باشد. نمره ي خام داراي اين ويژگي ها نيست. مشخص است كه IRT نسبت به نظريه كلاسيك ارجح است در اين رويكرد نياز به خطي بودن وجود ندارد و نمرات وابسته ي به نمونه سوالات يا نمونه افراد نيست. 
كاربرد مجموعه هاي فازي در يك مثال: مدل PCM يك مدل تك بعد براي سوالات چند بخشي است. اين مدل دشواري يك سري از طبقات كه به آنها گام مي گويند، را پامتري مي كند. يكي از ويژگي هاي اين روش اين است كه امكان تغيير گام در بين سوالات آن وجود دارد و اين ويژگي اي متمايز كننده ي براي آن محسوب مي شود. مدل PCM عضوي از خانواده ي مدل هاي خصيصه مكنون  راش محسوب مي شود كه داراي دو ويژگي عينيت خاص (Objective Specificity) در مقايسه ي سوالات و افراد و قدرت تفكيك پارامتر(Parameter separability) را دارا است. 
در اين ارائه مي خواهيم نحوه ي كاربرد نظريه ي فازي در مدل PCM را شرح داده تا از اين راه اعداد فازي بسازيم و اين اعداد فازي را در اندازه گيري روانشناسي به كار ببريم و يك مثال تجربي انجام شده را ذكر كنيم. 
براي درك بهتر بايد روش PCM توضيح داده شود و سپس نحوه ي ساخت اعداد فازي ذكر شود. 

تحليل stepdown

STEPDOWN ANALYSIS

همانند روش رگرسيون گام به گام مي ماند.  در هر دو روش ما علاقه منديم تا بدانيم يك متغيير چه مقدار به ارزش اضافه مي نماييد. در تحليل رگرسيون سوال اين است كه يك متغيير پيش بين چه مقدار به پيش بيني متغيير وابسته اضافه مي نمايد اين مقدار اضافه شدن بعد از ورود متغييرهاي پيش بيني است كه همبستگي بيشتر با متغيير وابسته دارند. سوال مربوط به تحليل STEPDOWN اين است كه چه مقدار يك متغيير وابسته به تمايز بين گروهها اضافه مي كند. اين مقدار اضافه شدن بعد از متغييرهاي وابسته ي قبلي و براي يك ترتيب منطقي و نظري مشخص قبلي از متغييرهاي وابسته مي باشد.


به دليل نياز روش STEPDOWN به ترتيبي قبلي از متغييرهاي وابسته نياز است اين ترتيب بندي منطقي و مبتني بر شواهد نظري و تجربي باشد. اگر اين ترتيب وجود داشته باشد، تحليل STEPDOWN مي تواند مشخص نمايد كه آيا ترتيب گروهها به خاطر اولين متغيير وابسته است يا خير. مقدار F  مربوط به اولين متغيير وابسته مانند همان F تك مغييره است. براي متغيير وابسته ي دوم در ترتيب، تحليل مشخص مي كند كه آيا بر اساس اين متغيير با توجه به اين كه اولين متغيير وابسته را به عنوان كواريانس و به منظور تعديل كردن اثرات متغيير دوم استفاده مي كنيم، تغيير مي كنند يا خير؟ F مربوط به تحليل STEPDOWN براي سومين متغيير وابسته در ترتيب بيانگر اين است كه آيا ترتيب اين گروهها بر اساس اين متغيير و بعد از اين كه اثرات متغييرهاي قبلي تعديل شده اند تغيير مي كند يا خير. در اين زمان متغييرهاي 1 و 2 به عنوان متغييرهاي كوواريانس منظور مي شوند. اين روند به همين صورت ادامه مي يابد. چون تحليل STEPDOWN نوعي تحليل كواريانس در نظر گرفته مي شوند، بنابراين بايد ابتدا اهداف تحليل كواريانس را فرا گرفت. 

اندازه گیری چند رویه ای راش (Many-facet rasch measurement)

نویسنده: محمد حسین ضرغامی(zar100@gmail.com) 09122263167

اندازه گیری چند رویه ای راش (Many-facet rasch measurement) :

این مدل اندازه گیری به سنجش عملکردی بسیار کمک کرده است. البته این مدل یکی از مدلهای تلفیقی دو نظریه ی تعمیم پذیری و نظریه ی سوال پاسخ است که به آنها GIRM گفته می شود. نظریه ی تعمیم پذیری نظریه ی نمونه گیری است که به پژوهشگر کمک می کند تا منابع خطای خود را به قسمت های مختلف تقسیم نماید. این تقسیم منابع خطا می تواند به شفاف شدن بهتر واریانس مورد مطالعه کمک نماید. از طرفی نظریه ی راش به عنوان یکی از نظریه های اندازه گیری که خود یک نظریه ی مقیاس گذاری است امکان سنجش و اندازه گیری تکالیف را فراهم می آورد. در سنجش عملکردی به جای سوالات و گزاره ها که در پرسشنامه ها و آزمون های شناختی استفاده می شوند از اصطلاح تکلیف استفاده می شود. بنابراین با استفاده از مدل سوال پاسخ می توان به مقیاس بندی و پارامتری کردن تکالیف و دستیابی به درجه دشواری و شیب تکالیف و همچنین عملکرد افتراقی سوالات دست یافت. حوزه ی کاربرد مدل چند رویه ای راش یا مدل های جیرم بیشتر در آموزش و آزمون سازی زبان و همچنین سنجش و اندازه گیری فعالیت های حرکتی در تربیت بدنی و ورزش وهمچنین استاندارد سازی رفتار و عملکرد بر می گردد که می تواند برای دانشجویان و دانش پژوهان در حوزه های مختلف مدیریت مورد نیاز باشد. استفاده از این رویکرد به منظور کالیبره کردن مصاحبه ها و امتحانات شفاهی مانند امتحانات قرائت کاربرد زیادی پیدا کرده است. حوزه های زبان آموزی و آِزمون سازی زبان مجموعه ی گسترده و متنوعی از روش ها را در بر می گیرد که هدف آنها اندازه گیری مهارت زبانی فرد یا چند جنبه مختلف این مهارت است. زمانی که رتبه دهنده یا امتیاز دهنده به دانش آموزان یا شرکت کننده گان رتبه می دهند نظرات آنها می تواند به عنوان یک رویه در کنار توانایی دانش آموزان و شرکت کنندگان و درجه ی سختی تکلیف ایجاد واریانس نماید که می تواند وابسته به هدف پژوهش واریانس خطا و یا واریانس مورد پژوهش قلمداد شوند. به این رویکرد اسامی مختلفی داده اند مانند

Many-facet rasch model, multi-facet rasch model,many faceted conjoint measurement, multi faceted rasch modeling

نرم افزارهای مختلفی برای اندازه گیری و سنجش در این حوزه استفاده شده اند که یکی از آنها FACET است که توسط گروه طراح نرم افزار WINSTEP  ایجاد شده است.

اندازه گیری رویکرد اندازه گیری چند رویه ای راش یا مدل های دیگر GIRM دارای سه گام مهم زیر می باشند.

گام اول: شکل دهی به مفروضات بر پایه ی رویه های مورد پژوهش که به یک سنجش مشخص مربوط می شود.

 

گام دوم: مشخص کردن مدل های اندازه گیری که برای مطالعه ی هر یک از رویه ها باید استفاده شود. در این بخش بحث گزینش مدل اندازه گیری مطرح است و بسیار به روانسنجی و سنجش و اندازه گیری مربوط است وباید به مدل های مختلف و روش های ترکیبی نظریات مختلف اندازه گیری آشنابود.

گام سوم: بکار بردن مدل برای در نظر گرفتن اثر هر رویه به صورت بهترین روش ممکن

Item response theory

Generalozabiltiy theory

Rasch model

FACET

Language testing

Sport

Performance assessment

task

 

نظريه ي تعميم پذيري (Generalizability theory) به عنوان نظريه اي براي مطالعه ي رويه ها(facet)ي موجود

نظريه ي تعميم پذيري يكي از نظريات اندازه گيري است كه با استفاده از تركيب نظريه ي كلاسيك سوال پاسخ و روش تحليل واريانس سعي در برآورد ضرايب اعتبار داشته است. قابليت هاي اين نظريه ي امكان مطالعه ي شرايط مختلف و مقايسه ي اعتبار امتيازات در شرايط مختلف را فراهم مي آورد. به مطالعاتي كه براي بررسي شرايط مختلف استفاده مي شوند، مطالعات تصميم گيري مي گويند. اين مطالعات امكان بررسي رويه ها(FACET) هاي مختلف به عنوان منابع مختلف واريانس يا پراكندگي در امتيازات را فراهم مي آورد. مشخص است كه هر چه پراكندگي بر اساس رويه يا FACET مورد مطالعه ( كه به آن رويه ي تفكيكي گويند) بيشتر باشد، بهتر و مناسب تر است (مانند آنچه در تحليل واريانس به عنوان واريانس بين آزمودني ها مطرح است) و هر چه واريانس ناشي از رويه هايي بجز رويه ي مورد مطالعه باشند، كمتر خواهد بود. 

به عنوان مثال زماني كه هدف پژوهش رتبه بندي پژوهشگران مختلف بر اساس كارهاي انجام داده ي آنها مي باشد و اين كار از طريق بررسي اقدامات علمي آنها توسط 5 نفر خبره انجام مي شود، تمايز پژوهشگران هدف اصلي مورد مطالعه و ساير رويه ها به عنوان رويه هاي مزاحم يا ابزاري instrumental facet شمرده مي شوند. 


تحليل تشخيصي يا تحليل تميز

در اين گزارش ابتدا توضيحات مهمي در مورد تحليل تشخيصي ارائه شده كه مي تواند به عنوان جزوه ي درسي مورد استفاده قرار گيرد. مطالب مربوطه را اينجانب شخصا گردآوري و ترجمه نموده ام. در انتهاي كار كاربردي حرفه اي از اين تكنيك ارائه شده است.

تحليل تشخيصي

این فن آماری یک مدل پیش بین برای عضویت گروهی است و از توابع تشخیصی تشکیل شده که از طریق ترکیب خطی متغییرهای پیش بین به بهترین تمییز بین گروهها می رسد. توابع براساس نمونه ای از اعضا (CASES) تشکیل می شود که عضویت آنها در گروهها از قبل مشخص است. از این توابع می توان برای پیش بینی عضویت گروهی موارد جدیدی استفاده کرد، که عضویت گروهی آنها مشخص نیست. در صورتی که ما مواردی داشته باشیم که عضویت همه ی آنها در گروهها را بدانیم می توانیم به صورت تصادفی تعدادی از آنها را انتخاب کرده و اعتبار توابع بدست آمده را از طریق موارد باقی مانده بررسی کنیم. به تحليل تشخيصي تحليل مميزي نيز گفته مي شود. هدف اصلي تحليل مميزي همانطور كه گفته شد تشخيص تفاوت بين گروهها و پيش بيني احتمال تعلق يك مورد به يك گروه خاص است كه براي اين طبقه بندي از چندين متغيير مستقل كمي استفاده مي كند. تحليل مميزي تكنيك چند متغيره است كه با جدا كردن مجموعه هاي متمايز مشاهده ها و با تخصيص مشاهده هاي جديد به دسته هاي از پيش تعريف شده سر و كار دارند. مسأله ي آماري در مورد به وجود آوردن يك قانون (تابع تشخيص) بر مبناي اندازه هاي حاصل از افراد مي باشد. با استفاده از اين قانون مي توان افراد جديد را كه معلوم نيست از كدام جمعيت هستند، به يكي از جمعيتها منتسب كرد. از معروف ترين توابع مورد استفاده در تحليل مميزي ميتوان به تابع مميز فيشر اشاره كرد.

مفروضات:

1.       موارد باید مستقل از یکدیگر باشند

2.       متغییرهای پیش بینی کننده باید دارای توزیع نرمال چند متغییری باشند و ماتریس واریانس- کواریانس بین گروهی باید در بین گروهها برابر باشد.

3.       موارد باید مانع الجمع باشند یعنی یک مورد باید فقط به یک گروه تعلق داشته باشد و در ضمن گروهها جامع باشند.

4.       اگر گروهها طبقات باشند این روش خیلی مناست است تما در صورتی که گروهها بر اساس نمرات با مقیاس فاصله ای یا نسبتی باشند مسلمن رگرسیون اطلاعات بیشتر در اختیار فرد می گذارد. 

اگر هدف ما بررسی معناداری تفاوت بین گروهها باشد می توان از:

1.       مانووا

2.       روش های جایگشتی (تبدیلی) چند پاسخی

3.       تحلیل تشابهات گروهها

4.       آزمون منتل

استفاده می شود. اگر بخواهیم ببینیم که گروهها چگونه از یکدیگر متمایز می شوند یعنی چه متغییرهایی بهترین تمایز را بین گروهها دارند می توان از:

1.       تحلیل تشخیصی 

2.       درختان رگرسیونی و تحلیل طبقه ای 

3.       رگرسیون لجستیک

4.       تحلیل گونه های نشانگر 

استفاده کرد. 

تحلیل تشخیصی یک تکنیک آماری است که به پژوهشگر این امکان را می دهد تا تفاوت های بین دو گروه یا بیشتر از دو گروه را برحسب چند متغییر به صورت همزمان مورد مطالعه قرار دهد. در این روش چند متغییر اسمی با چند متغییر فاصله ای مرتبط می شود و از لحاظ فنی در واقع بسط یافته ی تحلیل واریانس چند متغییری است. در حوزه ی علوم انسانی به این تکنیک نیاز است. در جایگرینی کارمندان، آزمون های روانشناختی کودکان، تاثیرات درمان های پزشکی، تفاوت های اقتصادی بین مناطق مختلف جغرافیایی، پیش بینی رفتار رای دهندگان و خیلی زمینه های دیگر.

چه زمان هایی می توان از تحلیل تشخیصی استفاده کرد؟ در این تحلیل تمرکز روی داده های مربوط به موارد است که این موارد می توانند انسان ها، حیوانات، وضعیت اقتصادی در زمان های مختلف  و خیلی موارد دیگر باشد. گروهها باید طوری تعریف شوند که هر مورد فقط و فقط به یک گروه تعلق داشته باشد. زمان هایی که نمی توان عضویت موارد در گروهها را نمی توان تشخیص داد باید این موارد از تحلیل کنار گذاشته شوند تا به نتایج خطا منجر نشود. این موارد بعد از رسیدن به معادلات تشخیصی می توان عضویت گروهی شان را مشخص کرد.  

تفسیر فضایی از تحلیل تشخیصی

اگر متغییرهای پیش بین را که گروهها بر اساس آنها متمایز می شوند را به عنوان محورهای یک فضای P بعدی در نظر بگیریم هر مورد در این فضا دارای یک نقطه خواهد بود. بنابراین گروهها در این فضا از چندین نقطه ی کنار هم تشکیل می شود. اگر گروهها با هم نقاط اشتراکی داشته باشند در این صورت دیگر گروه ها یگانه نخواهند بود. به منظور خلاصه کردن نقاط در یک گروه باید مرکزیت هر گروه را پیدا کرد. نقطه ی مرکزی یا همان مرکز ثقل در مختصات هندسى نقطه اى است که مختصات ان ميانگين حسابى مختصات همه نقاط ان شکل است. چون هر یک از این نقاط معرف هر گروه می باشند می توان با مطالعه ی این نقاط متوجه شد که گروهها چگونه از یکدیگر متمایز می شوند. زمانی که تعداد متغییرها زیاد است ممکن است اطلاعات خیلی پیچیده و غیر قابل فهم شوند. 

محدودیت های  تحلیل تشخیصی

1.       تحلیل تشخیصی به نقاط پراکنده حساس است.

2.       ملاحظات مربوط به حجم نمونه.

الف) حداقل باید موارد 2 تا بیشتر از متغییرها باشند.

ب) در هر گروه حداقل باید دو مورد باشد.

ج) در هر گروه باید تعداد نمونه ها به اندازه ی کافی باشد تا میانگین ها و انحرافات به طور مشخصی برآورد شوند. بر اساس یک قانون سر انگشتی باید n بزرگتر مساوی 3*p باشد.

روش های حجم نمونه

الف) نمونه ی زنجیره ای تا زمانی که برآورد پارامترهای میانگین و واریانس ثابت شود.

ب) این ثبات می تواند از طریق روش های بازنمونه گیری مورد آزمایش قرار گیرد.

ج) به منظور کاهش متغییر ها می توان از طریق روش گام به گام استفاده کرد.

د) متغییر ها را به دو یا چند گروه مرتبط تقسیم کرده و در هر گروه یک تحلیل تشخیصی اجرا کنید.

ه) یافته ها را با دقت تفسیر کنید

تحلیل تشخیصی برای طبقه بندی پاسخگویان بر اساس مقادیر یک متغیر وابسته دو یا چند وجهی به کار می رود. در واقع زمانی که متغیر پاسخ کیفی و متغیرهای مستقل کمی باشند از این تحلیل استفاده می کنیم. در این تحلیل پاسخگویان بر حسب مقداری که بدست می آورند، در طبقات مختلف تفکیک می شوند. 

تحلیل تشخیصی روشی است که متغیرهای مستقل را برای ایجاد یک متغیر جدید ترکیب می کند که  هر یک از پاسخگویان برای آن مقداری بدست می آورند. در واقع تحلیل تشخیصی شبیه یک رگرسیون خطی چندمتغیره است با این تفاوت که در رگرسیون خطی چندمتغیره، متغیر پاسخ در سطح فاصله ای/نسبی است، اما در تحلیل تشخیصی مقیاس متغیر وابسته دو یا چندوجهی است. 

تحلیل تشخیصی را می توان برای چندین هدف مورد استفاده قرار داد که مهمترین آنها به شرح زیر است:

1-    طبقه بندی پاسخگویان به چندین گروه 

2-    بررسی اختلاف های میانگین متغیر مستقل بین گروههایی که بر اساس متغیر وابسته تشکیل می شوند.

3-    تعیین درصدی از واریانس متغیر وابسته که توسط متغیرهای مستقل تبیین شده اند.

4-    ارزیابی اهمیت نسبی متغیرهای مستقل در طبقه بندی متغیر وابسته 

به منظور تحلیل تشخیصی لازم است که یک سری از پیش فرضها رعایت شود، بر این اساس، پیش فرضهای تحلیل تشخیصی به صورت زیر است

1-    متغیر وابسته یک متغیر اسمی دو وجهی (یا چند وجهی) است.

2-    تمامی پاسخگویان (موارد) باید از یکدیگر  مستقل باشند. بنابراین نمی توان داده های مرتبط استفاده کرد.

3-    حداقل باید دو پاسخگو برای هرگروه وجود داشته باشد.

4-    حداکثر تعداد متغیر مستقل در مدل باید برابر با n-2 باشد.

5-    خطاها به طور تصادفی توزیع شده باشند.

6-     نداشتن همخطی: اگر یکی از متغیرهای مستقل همبستگی بالایی با متغیرهای دیگر داشته باشد و یا اینکه یکی از متغیرهای مستقل تابع متغیرهای دیگر باشد، همخطی بوجود می آید. 

در تحلیل  تشخیصی یک تابع تشخیصی وجود دارد که به ریشه کانونی معروف است و ترکیب خطی متغیرهای مستقل استاندارد شده را نشان می دهد. در واقع تابع تشخیص بر اساس مرکز ثقل گروهها ایجاد می شود. تعداد توابع تشخیص عبارت است از:

min(groups-1, predictors).

 در رابطه بالا، groups همان تعداد حالتهای متغیر پاسخ و predictors تعداد متغیرهای تبیینی است.


رگرسيون لوژستيك (لوجستيك)

رگرسيون لوژستيك (لوجستيك)

زماني كه متغيير وابسته ي ما دو وجهي است و مي خواهيم از طريق تركيبي از متغييرهاي پيش بين دست به پيش بيني بزنيم بايد از رگرسيون لوجستيك استفاده كنيم. چند مثال از كاربردهاي رگرسيون لوژستيك در زير ارائه مي گردد.

1. در فرايند همه گير شناسي ما مي خواهيم ببينيم آيا يك فرد بيمار است يا خير. اگر به عنوان مثال بيماري مورد نظر بيماري قلبي باشد پيش بيني كننده ها عبارتند از سن، وزن، فشار خون سيستوليك، تعداد سيگارهاي كشيده شده و سطح كلسترول.

2. در بازاريابي ممكن است بخواهيم بدانيم آيا افراد يك ماشين جديدي را مي خرند يا خير. در اينجا متغييرهايي مانند درآمد سالانه، مقدار پول رهن، تعداد وابسته ها، متغيرهاي پيش بين مي باشند. 

3. در تعليم و تربيت فرض كنيد مي خواهيم بدانيم يك فرد در امتحان نمره مي آورد يا خير.

4. در روانشناسي مي خواهيم بدانيم آيا فرد يك تكليف را انجام مي دهد يا خير.

در تمام موارد گفته شده متغيير وابسته يك متغيير دو حالتي است كه دو ارزش دارد. زماني كه متغيير وابسته دو حالتي است مسايل خاصي مطرح مي شود.

1. خطا داراي توزيع نرمال نيست.

2. واريانس خطا ثابت نيست.

3. محدوديت هاي زيادي در تابع پاسخ وجود دارد.

مشكل سوم مطرح شده مشكل جدي است. مي توان از روش حداقل مجذورات وزني براي حل مشكل مربوط به واريانس هاي نابرابر خطا استفاده نمود. بعلاوه زماني كه حجم نمونه بالا باشد مي توان روش حداقل مجذورات برآوردگرهايي را ارائه مي دهد كه به طور مجانبي و تحت موقعيت هاي نسبتا عمومي نرمال مي باشند.

ما در رگرسيون لوژستيك به طور مستقيم احتمال وقوع يك رخداد را محاسبه  مي كنيم. چرا كه فقط دو  حالت ممكن براي متغيير وابسته ي ما وجود دارد. اين احتمال براي زماني كه چند متغيير مستقل وجود دارد به صورت زير محاسبه مي شود:

 

كه در آن z تركيب خطي زير است:


دو مساله ي مهم كه بايد در ارتباط با رگرسيون لوجستيك در نظر داشته باشيم عبارتند از:

1. رابطه ي بين پيش بيني كننده ها و متغيير وابسته غير خطي است.

2. ضرايب رگرسيوني از طريق روش ماكزيمم درستنمايي برآورد مي شود.

رگرسيون لوژستيك از لحاظ محاسبات آماري شبيه رگرسيون چند گانه است اما از لحاظ كاركرد مانند تحليل تشخيصي مي باشد. در اين روش عضويت گروهي بر اساس مجموعه اي از متغييرهاي پيش بين انجام مي شود دقيقا مانند تحليل تشخيصي. مزيت عمده اي كه تحليل لوجستيك نسبت به تحليل تشخيصي دارد اين است كه در اين روش با انواع متغييرها به كار مي رود و بنابراين بسياري از مفروضات در مورد داده ها را به كار ندارد. در حقيقت آنچه در رگرسيون لوژستيك پيش بيني مي شود يك احتمال است كه ارزش آن بين 0 تا 1 در تغيير است. 

ضرايب رگرسيوني مربوط به معادله ي رگرسيون لجستيك اطلاعاتي را راجع به شانس هر مورد خاص براي تعلق به گروه صفر يا يك ارائه مي دهد. شانس به صورت احتمال موفقيت در برابر شكست تعريف مي شود. ولي بدليل ناقرينگي و امكان وجود مقادير بي نهايت براي آن تبديل به لگاريتم شانس مي شود. هر يك از وزن ها را مي توان از طريق مقدار خي دو كه به آماره ي والد مشهور است به لحاظ معناداري آزمود. لگاريتم شانس، شانسي را كه يك متغيير به طور موفقيت آميزي عضويت گروهي را براي هر مورد معين پيش بيني مي كند را نشان مي دهد. 

به طور كلي در روش رگرسيون لجستك رابطه ي بين احتمال تعلق به گروه 1 و تركيب خطي متغييرهاي پيش بين بر اساس توزيع سيگمودال تعريف مي شود.

 

 براي دستيابي به معادله ي رگرسيوني و قدرت پيش بيني بايد به نحوي بتوان رابطه اي بين متغييرهاي پيش بين و وابسته تعريف نمود. براي حل اين مشكل از نسبت احتمال تعلق به گروه يك به احتمال تعلق به گروه صفر استفاده مي شود. به اين نسبت شانس گويند. به خاطر مشكلات شانس از لگاريتم شانس استفاده مي شود. لگاريتم شانس با متغييرهاي پيش بيني كننده ارتباط خطي دارد. بنابراين ضرايب بدست آمده براي آن بايد بر اساس رابطه ي خطي كه با لگاريتم شانس دارند تفسير گردند. بنابراين اگر بخواهيم تفسير را بر اساس احتمال تعلق به گروهها انجام دهيم بايد لگاريتم شانس را به شانس و شانس را به اجزاي زير بنايي آن كه احتمال تعلق است تبديل نماييم. آماره ي والد كه از توزيع خي دو پيروي مي كند نيز براي بررسي معناداري ضرايب استفاده مي شود. از آزمون هوسمر و لمشو نيز براي بررسي تطابق داده ها با مدل استفاده مي شود معنادار نبودن اين آزمون كه در واقع نوعي خي دو است به معناي عدم تفاوت داده ها با مدل يعني برازش داده با مدل است. 

رگرسيون چند متغييري

در اين رگرسيون هدف اين است كه از طريق مجموعه اي از متغييرهاي پيش بين به پيش بيني چند متغيير وابسته پرداخته  شود در واقع اتفاقي كه در رگرسيون كانوني مي افتد. 


lمعرفي قسمت هاي مختلف يك كتاب آمار توصيفي و استنباطي

كتاب ارشد

فهرست مطالب

بخش اول _ آمار توصيفي

فصل اول _ كليات

1 تعريف آمار و اهميت آن ....................................................................................................................................................... 1

2 سنجش و يا انداز هگيري........................................................................................................................................................ 2

3 انواع مقيا سهاي اندازه گيري................................................................................................................................................. 3

4 انواع داد ههاي آماري............................................................................................................................................................. 5

5 علائم آماري .......................................................................................................................................................................... 6

11.......................................................................................................................................................................... ( خودآزمائي ( 1

15.........................................................................................................................................................( پاسخنامه خودآزمائي ( 1

فصل دوم _ تنظيم و جدولبندي داده هاي آماري

1 جدولبندي داده هاي مقياس اسمي و رتبه اي ...................................................................................................................... 17

1 جدولبندي داده هاي يك متغيري ............................................................................................................................ 17 _1

1 جدولبندي داده هاي چندمتغيري........................................................................................................................... 18 _2

2 جدول توزيع فراواني در داد ههاي داراي مقياس نسبي و فاصل ها ي............................................................................... 18

2 تشكيل جدول فراواني............................................................................................................................................ 19 _1

2 توزيع فراواني طبقه بندي شده .............................................................................................................................. 20 _2

2 مراحل ساختن توزيع فراواني طبق ه بندي شده..................................................................................................... 21 _3

24.......................................................................................................................................................................... ( خودآزمائي ( 2

26.........................................................................................................................................................( پاسخنامه خودآزمائي ( 2

فصل سوم _ نمودارهاي فراواني

1 رسم نمودارها در داد ههاي مقياس نسبي و فاصل هاي ..................................................................................................... 27

1 نمودار چند ضلعي ................................................................................................................................................. 27 _1

1 نمودار هيستوگرام (ستوني)................................................................................................................................. 29 _2

1 نمودار فراواني متراكم (تجمعي) يا منحني گالتون .............................................................................................. 30 _3

1 منحني درصد فراواني متراكم (اُجي و) ................................................................................................................... 31 _4

-1-5 نمودار شاخ و برگي....................................................................................................................................................

2 رسم نمودارها در داد ههاي مقياس اسمي و رتب ها ي ........................................................................................................ 33

2 نمودار ميله ا ي......................................................................................................................................................... 33 _1

2 نمودار داير هاي....................................................................................................................................................... 34 _2

36.......................................................................................................................................................................... ( خودآزمائي ( 3

38.........................................................................................................................................................( پاسخنامه خودآزمائي ( 3

فصل چهارم _ اندازه هاي گرايش مركزي

الف) ميانگين ............................................................................................................................................................................... 39

1 ميانگين حسابي ................................................................................................................................................................... 39

1 خواص ميانگين ...................................................................................................................................................... 40 _1

1 محاسبه ميانگين داد هها......................................................................................................................................... 41 _2

44.......................................................................................................................................................... (G) 2 ميانگين هندسي

45............................................................................................................................................................(H) 3 ميانگين همساز

ب) ميانه .................................................................................................................................................................................... 45

1 محاسبه ميانه ...................................................................................................................................................................... 46

2 محاسبه نقاط درصدي ...................................................................................................................................................... 48

3 محاسبه رتبه درصدي ...................................................................................................................................................... 48

ج) نما .......................................................................................................................................................................................... 49

53 .......................................................................................................................................................................... ( خودآزمائي ( 4

56 ........................................................................................................................................................ ( پاسخنامه خودآزمائي ( 4

فصل پنجم _ شاخص هاي پراكندگي

الف) شاخص هاي پراكندگي در مورد داد ههاي مقياس نسبي و فاصل هاي........................................................................... 59

59 .............................................................................................................................................................. (R) 1 دامنه تغييرات

2 دامنه بين صد كها و دامنه بين ده كها...................................................................................................................... ........ 59

61 .................................................................................................................................. (A.D) 3 انحراف متوسط از ميانگين

4 واريانس و انحراف استاندارد............................................................................................................................................ 62

67 ................................................................................................................................................. (CV) 5 ضريب تغييرپذيري

ب) شاخص هاي پراكندگي در مورد داده هاي مقياس اسمي و رتب ها ي................................................................................. 67

ج) محاسبه انحراف استاندارد مركب...................................................................................................................................... 69

د) تركيب نمر هها با يك عدد ثابت و تاثير آن در شاخ صهاي پراكندگي ............................................................................. 69

ه) گشتاورهاي پيرامون ميانگين ............................................................................................................................................ 70

73 .......................................................................................................................................................................... ( خودآزمائي ( 5

75 ........................................................................................................................................................ ( پاسخنامه خودآزمائي ( 5

فصل ششم _ همبستگي و رابطه متغيرها

1 مفهوم و ضريب همبستگي ................................................................................................................................................. 76

2 نمودارهاي پراكنده................................................................................................................................................................. 77

3 روشهاي محاسبه ضريب همبستگي بين متغيرها ............................................................................................................ 80

3 روشهاي محاسبه ضريب همبستگي در داد ههاي مقياس فاصل هاي و نسبي ................................................... 80 _1

3 روشهاي محاسبه همبستگي در داد ههاي مقياس ترتيبي ..................................................................................... 86 _2

86.............................................................................................. (rS) روش اول: محاسبه ضريب همبستگي تفاوت رتب هاي

88 .......................................................................................................... (τ) روش دوم: محاسبه ضريب همبستگي كندال

عوامل موثر بر ضريب همبستگي ................................................................................................................................ ... 88

تفسير ضريب همبستگي .................................................................................................................................................... 89

3 روشهاي محاسبه همبستگي در داد ههاي مقياس طبقه اي (اسمي) .................................................................... 90 _3

4 ساير روشهاي محاسبه ضريب همبستگي........................................................................................................................ 90

90 .............................................................................................................. (rPbis) 4 همبستگي دو رشته اي نقطه اي _1

91 ................................................................................................................. (rbis) 4 ضريب همبستگي دو رشته اي _2

92 ................................................................................................................................................... (Φ) 4 ضريب فاي _3

93 ......................................................................................................................... (rt) 4 ضريب همبستگي تتراكوريك _4

95 .......................................................................................................................................................................... ( خودآزمائي ( 6

98 ........................................................................................................................................................ ( پاسخنامه خودآزمائي ( 6

بخش دوم _ آمار استنباطي

فصل هفتم _ احتمالات

1 تئوري احتمالات و مفهوم احتمال .................................................................................................................................... 103

2 احتمال وقوع يك پيشامد .................................................................................................................................................. 103

3 احتمال پيشامدهاي مركب................................................................................................................................................ 106

3 استفاده از قوانين و قضاياي مربوط به احتمالات............................................................................................. 106 _1

3 استفاده از بسط دو جمل هاي نيوت ن ..................................................................................................................... 108 _2

_ بسط دوجمل هاي نيوت ن ......................................................................................................................................... 110

_ جدول مثلث پاسكال ............................................................................................................................................. 113

4 استفاده از سطح زيرمنحني نرمال .................................................................................................................................. 113

118........................................................................................................................................................................ ( خودآزمائي ( 7

122.......................................................................................................................................................( پاسخنامه خودآزمائي ( 7

فصل هشتم _ توزيع و منحني طبيعي

مفهوم زيرمنحني طبيعي ......................................................................................................................................................... 125

سطح زيرمنحني طبيعي ........................................................................................................................................................... 125

نمره هاي تراز شده و سطح زيرمنحني طبيعي ...................................................................................................................... 126

134........................................................................................................................................................................ ( خودآزمائي ( 8

137.......................................................................................................................................................( پاسخنامه خودآزمائي ( 8

فصل نهم _ استنباط آماري

1 مفهوم استنباط آماري...................................................................................................................................................... 139

2 خصوصيات برآوردكنند هها.............................................................................................................................. 140

3 طرح كلي برآورد پارامتر .................................................................................................................................. 141

4 توزيع نمونه بردار ي .......................................................................................................................................... 141

5 خصوصيات ميانگين نمون ههاي منتخب از يك جامعه (فضيه حد مركزي) .......................................................... 142

6 خطاي استاندارد شاخ صهاي آماري................................................................................................................. 145

7 برآورد فاصله اي _ آزمون فرضيه .................................................................................................................... 148

8 منطق آزمودن فرضي هها ................................................................................................................................... 149

9 نتايج آزمون فرضيه ......................................................................................................................................... 151

10 _ كارآئي آزمون آماري..................................................................................................................................... 153

11 _ برآورد حجم (اندازه) گروه نمونه.................................................................................................................... 153

الف) برآورد حجم نمونه براي مطالعه متغيرهاي كمي ............................................................................................. 154

ب) برآورد حجم نمونه در مورد داد ههاي متغير اسمي يا طبق ه اي............................................................................ 156

157 ...................................................................................................................................................( خودآزمائي ( 9

159.......................................................................................................................................................( پاسخنامه خودآزمائي ( 9

فصل دهم _ آزمون هاي آماري (پارامتري)

1 آزمو ن آماري و انواع آن ................................................................................................................................................. 161

2 آزمو نهاي پارامتريك و پي شفرض هاي مربوط به آن .................................................................................................. 161

3 انواع آزمو نهاي پارامتر ي............................................................................................................................................... 162

3 آزمون ميانگين تك گروهي ................................................................................................................................. 162 _1

3 آزمون معني دار بودن تفاوت بين ميانگين دو گروه.......................................................................................... 167 _2

3 آزمون تفاوت ميانگين دو گروه مستقل در گرو ههاي بزرگ........................................................................... 168 _3

169......................................................... (N< 3 آزمون تفاوت ميانگين دو گروه مستقل در گرو ههاي كوچك ( 30 _4

3 آزمون تفاوت واريانس دو گروه مستقل............................................................................................................ 170 _5

براي دو گروه مستقل با واريان س هاي نابرابر ................................................................................... 172 t 3 آزمون _6

براي گروه نمونه وابسته ...................................................................................................................... 173 t 3 آزمون _7

3 آزمون تفاوت واريانس دو گروه همبسته .......................................................................................................... 176 _8

3 آزمون معن يدار بودن تفاوت ميانگين بيش از دو گروه مستقل (تحليل واريانس يك طرفه )........................ 176 _9

3 تحليل واريانس يك راهه وابسته ...................................................................................................................... 182 _10

3 مقايسه هاي پس از تجربه ................................................................................................................................. 184 _11

3 تحليل واريانس عاملي ....................................................................................................................................... 188 _12

3 آزمون معني دار بودن ضريب همبستگي ......................................................................................................... 192 _13

196..................................................................................................................................................................... ( خودآزمائي ( 10

203....................................................................................................................................................( پاسخنامه خودآزمائي ( 10

فصل يازدهم _ آزمو نهاي آماري ناپارامتري

208........................................................................................................chi-square - test χ 1 آزمون مجذور خي (كاي) 2

(S )

1 آزمون تك متغيري مجذ ور كاي ......................................................................................................................... 208 _1

1 آزمون مجذور خي در طبقه بندي هاي دو طرفي................................................................................................ 211 _2

2 آزمون تفاوت نسب تها و درصدها.................................................................................................................................. 215

2 آزمون معن يدار بودن تفاوت بين دو نسبت مستقل.......................................................................................... 215 _1

2 آزمون معن يدار بودن تفاوت بين دو نسبت همبسته........................................................................................ 217 _2

3 مقايسه گروههاي مستقل در متغير رتبه اي ...................................................................................................................... 218

مان _ وتيني ....................................................................................................................................... 218 U 3 آزمون _1

3 آزمون ميانه ......................................................................................................................................................... 221 _2

4 مقايسه بيش از دو گروه مستقل در يك متغير رتب ه اي (تحليل واريانس رتب ه اي كروسكال واليس ) .......................... 222

-5 مقايسه بيش از دو گروه از آزمونهاي يكسان و ياهمتا شده (تحليل وايانس فريدمن) در يك متغير رتب ه اي ......... 225

6 استنباط آماري در مسائل مربوط به دو مجموعه از انداز ههاي وابسته طبقه ا ي ......................................................... 226

7 استنباط آماري براي مسائل مربوط به دو مجموعه از انداز ههاي وابسته رتبه اي ...................................................... 228

228.............................................................................................................. (T) آزمون رتبه هاي علامت دار ويلكاكسون

8 آزمون تك متغيري كالموگروف اسميرنف ..................................................................................................................... 230

9 ضريب هماهنگي (تطابق) كندال ....................................................................................................................................... 231

234.................................................................................................................................................................... ( خودآزمائي ( 11

240....................................................................................................................................................( پاسخنامه خودآزمائي ( 11

فصل دوازدهم _ رگرسيون و پيش بيني

1 مفهوم رگرسيون............................................................................................................................................................... 245

225................................................................................................................................... (Z) 2 پيش بيني نمر ههاي تراز شده

3 رگرسيون به طرفه ميانگين.............................................................................................................................................. 225

4 خط رگرسيون و معادله آن............................................................................................................................................. 226

250.............................................................................................................................. Eest 5 خطاي استاندارد برآورد

6 رگرسيون چند متغيره ...................................................................................................................................................... 251

254..................................................................................................................................................................... ( خودآزمائي ( 12

256....................................................................................................................................................( پاسخنامه خودآزمائي ( 12

259.......................................................................................... « آمار توصيفي » سوال هاي چند گزين هاي مربوط به بخش اول

286................................................................................................... « آمار توصيفي » كليد و پاسخ سوال هاي بخش اول

305........................................................................................ « آمار استنباطي » سوال هاي چند گزين هاي مربوط به بخش دوم

344................................................................................................. « آمار استنباطي » كليد و پاسخ سوال هاي بخش دوم

366............................................................................................................................................ تست هاي سراسري سال 1388

جداول ضميمه ........................................................................................................................................................................ 373

خذ ........................................................................................................................................................ 408 Ĥ منابع و م

فصل اول

كليات

1 تعريف آمار و اهميت آن

واژه آمار در لغت به معني شمردن و حساب كردن است ولي علم آمار فعاليتي گسترد ه تر از شمارش و

ارائه حقايق به صورت اعداد و ارقام است . علم آمار به مجموعه اي از فنون و روشهاي علمي _ رياضي

گفته مي شود كه براي جمع آوري، ت نظيم، ارائه، و تحليل و تفسير اطلاعات كمي و كيفي و نتيج ه گيري از آنها

در جهت هدفي معين به كار مي رود. 1

علم آمار و روشهاي آن قسمتي از رو ش هاي تحقيق علوم را تشكيل مي دهد و اهل تحقيق در همه رشت ه ها

بدان نيازمندند . اما ضرورت آمار صرفاً به كار تحقيقي محدود نم ي شود. روشهاي آماري داراي دو وظيفه

هستند:

1: روش هاي آماري در طبقه بندي، خلاصه كردن، توصيف و تفسير اطلاعات جمع آوري شده و برقراري _1

ارتباط از طريق آنها، به پژوهشگر كمك مي كنند. روش هاي آماري كه براي اين وظيفه بكار مي روند آمار

توصيفي 2 ناميده مي شوند. روشهاي آمار توصيفي هميشه براي تعيين و بيان ويژگ ي ها و اطلاعاتي كه به

وسيله پژوهشگران از يك گروه نمونه آماري جمع آوري شده اند بكار برده م يشوند.

1: به پژوهشگران امكان مي دهند كه با استفاده از اطلاعات جمع آوري شده از نمونه كوچكي از _2

آزمودني ها، ويژگيهاي جامعه اي ر ا كه نمونه از آن انتخاب شده است برآورد يا استنباط كن ن د. روشهاي

آماري مربوط به اين وظيفه را آمار استنباطي 3 مي نامند. در آمار استنباطي هدف پژوهشگر عبارت از تعميم

اصول و يافته ها به نحوي است كه قادر باشد حوادث را تبيين و پيش بيني كند، بنابراين از آمار استبناط ي

مي توان از طريق يافته هاي حاصل از گرو ه هاي كوچك دربارة گرو ه هاي بزرگ به استنباط پرداخت .

صرفنظر از ارزش آموزشي آمار، مي توان مهمترين موارد اهميت آن را به ترتيب زير بيان كرد:

الف) جمع آوري و ارزشيابي اطلاعات و تعميم و كاربرد علمي و فوري آنها در جهت ايجاد س هولت و

كارآئي در فعاليتهاي روزمره

ب) كشف و جم عآوري اطلاعات براي حل مسائل عملي و تجزيه و تحليل اطلاعات موجود.

-1 روشهاي آماري در علوم رفتاري، شريفي و نجفي زند

2- descriptive Statistics

3- Inferential Statistics

فصل دوم

تنظيم و جدول بندي داده هاي آماري

پس از گردآوري داده هاي آماري لازم است كه طوري تنظيم و سازماندهي شوند كه بهتر بتوان اطلاعات

مورد نياز را به روشني و به دقت از آنها استخراج كرد . براي اين منظور نخست بايد داده ها به صورت

جدول هاي آماري تنظيم شوند . نحوة تنظيم و جدول بندي داده ها را با توجه به نوع مقياس اندازه گيري آنها

در دو بخش توضيح مي دهيم.

1 جدول بندي داده هاي مقياس اسمي و رتب هاي

جداول مربوط به اين بخش ممكن است مربوط به داده هاي يك متغيري و يا چند متغيري باشند.

1 جدول بندي داده هاي يك متغيري: _1

مراد از داده هاي اسمي يك متغيري اين است كه فقط يك صفت يا متغير در مورد افراد نمونه آماري مورد

مشاهده قرار گرفته و موارد تكرار يا فراواني آن يادداشت مي شود. در مورد داده هاي مقياس رتبه اي نيز

رتبه ها را همراه با توصيف آنها (در صورت لزوم ) به ترتيب نزولي و يا صعودي مي نويسيم و پس از

(2_ استخراج فراواني هر رتبه، نسبت و يا درصد مربوط به آن را محاسبه و ثبت مي كنيم . در جدول ( 1

توزيع فراواني يك گروه نمونه 100 نفري از دانشجويان براساس رشته تحصيلي (مقياس اسمي ) و در

2) توزيع فراواني يك گروه نمونه 80 نفري از د انشجويان برحسب ميزان تمايل به ازدواج _ جدول ( 2

براي هر يك محاسبه گرديده است. (P%) و درصدي (P) (مقياس رتبه اي) نشان داده شده و فراواني نسبي

(2_ 2) جدول ( 1 _ جدول ( 2

فراواني درصدي

P%

فراواني نسبي

P

ميزان تمايل به F فراواني

ازدواج

فراواني

P% درصدي

رشته F فراواني P فراواني نسبي

تحصيلي

45 مشاوره 0/45 20 بسيار زياد 45 0/25 25

35 روانشناسي 0/35 30 زياد 35 0/38 37/5

20 علوم اجتماعي 0/20 15 تاحدودي 20 0/19 19

Σ N=100 ΣP=1 ΣP%= 10 كم 100 0/12 12/5

5 بسيار كم 0/06 6

Σ 80 ΣP=1 ΣP%=100

فصل سوم

نمودارهاي فراواني 1

رابطه بين نمره ها و فراوانيها نخستين نتيجه اي است كه از تنظيم و بررسي داده هاي آزمايشي به دست

مي آيد اين رابطه را بصورت كلي و كيفي از جدول فراواني و بصورت دقيق و كمي از راه محاسبه مي توان

مشخص كرد.

بررسي كلي توزيع فراواني را روشن تر از آنچه در جدول فراواني گفتيم با تشكيل نمودارهاي فراواني

مي توان انجام داد. نمودار فراواني نمايش هندسي جدول فراواني است.

نمودار ابزاري تصويري است كه براي توصيف و نمايش داده هاي جمع آوري شده بكار برده مي شود. پس

از سازمان بندي كردن داده ها در جدول توزيع فراواني، نمايش آنها به وسيله نمودار به پژوهشگر كمك

مي كند تا ويژگيهاي داده ها را بهتر و آسا نتر توصيف كند و آنها را با توزي عهاي ديگر مقايسه كند.

رسم نمودارها و منحن يها 2

در اين قسمت روش ترسيم نمودارها در دو بخش توضيح داده مي شود.

1 رسم نمودارها در داده هاي مقياس نسبي و فاصل هاي:

براي رسم نمودارهاي فراواني كه نمايش هندسي جدول فراواني مي باشند از محور مختصات استفاده

مي كنيم و مقياس نمره ها را در طول و فراوانيها را در عرض محور نشان مي دهيم. در اين بخش به توضيح

روش ترسيم و استفاده از نمودارهاي چند ضلعي 3، هيستوگرام (ستوني ) 4، فراواني متراكم (تجمعي ) 5 و

اُجيو 6 يا منحني درصد فراواني متراكم 7 كه در مورد داده هاي مقياس نسبي و فاصله اي بكار برده م يشوند

مي پردازيم.

1 نمودار چند ضلعي: (چند كنج فراواني) _1

همانطوري كه قبلاً اشاره شد زماني كه داده ها داراي مقياس فا صله اي و كميت ها پيوسته هستند از اين

را برحسب (XX') نمودار استفاده مي شود. ابتدا محورهاي مختصات را رسم مي كنيم و سپس محور افقي

1- Frequency diagram

2- Curves

3- Polygon

4- Histogram

5- Cumulative frequency graph

6- Ogive

7- Cumulative percentage curve

فصل چهارم

اندازه هاي گرايش مركزي

براي آن دسته از داده ها به كار مي رود « شاخص آماري » يا « آماره » همانطوري كه قبلاً اشاره شد اصطلاح

كه در مورد يك گروه نمونه به دست آمده است . اين شاخصها نشان مي دهند كه موارد مطالعه شده به

طور كلي چگونه اند و به طور متوسط چ ه وضعي دارند . اين شاخص ها در معناي متوسط تحت عنوان

اندازه هاي گرايش مركزي مطرح مي شوند و عبارتند از:

الف) ميانگين

ب) ميانه

ج) نمايامد

هر يك از اين شاخصها به نوعي معرف مقدار متوسط يا اندازه گرايش مركزي داده ها تلقي م يشوند و ذيلاً

مورد بحث قرار م يگيرند.

: الف) ميانگين 1

اين شاخص كه براي بيان و توصيف داده هاي كمي بيش از ساير اندازه ها به كار مي رود به سه صورت

مطرح مي شود

1 ميانگين حسابي 2

2 ميانگين هندسي 3

3 ميانگين همساز 4

اينك به توضيح هر يك از آنها مي پردازيم:

1 ميانگين حسابي:

نشان مي دهند ميانگين از طريق M يا X ميانگين حسابي را براي سهولت ت نها ميانگين مي نامند و با

محاسبه خارج قسمت مجموع نمره ها بر تعداد آنها به دست مي آيد.

(4_1) n

X

X Σ =

1- Mean

2- Arithmetic Mean

3- Geometric Mean

4- Harmonic Mean

فصل پنجم

شاخص هاي پراكندگي 1

در فصل 4 موارد استفاده از شاخصهاي مركزي كه براي تعيين مقدار متوسط توزيع نمره ها به كار برده

مي شود مورد بحث قرار گرفت، اما براي توصيف كامل تر خصوصيات آماري نمره ها بايد به نحوة

پراكندگي داده ها حول ميانگين يا ميانه نيز توجه كرد. پراكندگي يكي از ويژگيهاي عمومي توزيع نمره ها

است كه پژوهشگران در صدد مطالعه آنها هستند . به عنوان مثال ميانگين نمره ها در سه گروه 5 نفري ذيل

برابرند اما نم يتوان گفت كه شاگردان سه گروه بطور كلي همقوه اند.

12-11-10-9- گروه اول: 8

17-15-7-6- گروه دوم: 5

20-19-6-4- گروه سوم: 1

گروه اول شامل شاگردان متوسط، گروه دوم شامل شاگردان ضعيف و قوي و گروم سوم از شاگردان

بسيار قوي و بسيار ضعيف تشكيل شده است . فرقي كه بين اين گروه ها وجود دارد و ميانگين آنرا نشان

نمي دهد چگونگي توزيع نمره ها در اطراف مقدار متوسط است . اين خ صوصيت را در آمار پراكندگي 2

5 دو منحني فراواني نشان مي دهد كه ميانگين هر دو 10 است اما پراكندگي آن ها با هم _ مي نامند. شكل 1

از 5 تا 15 است) B پراكندگي از صفرتا 20 و در منحني A اختلاف فاحش دارند (در منحني

5_ شكل 1

1- Variability

2- Dispression

فصل ششم

همبستگي

1 مفهوم همبستگي 1

در فصلهاي پيشين، توصيف يك متغير مورد توجه قرار گرفت . اما در پژوهش موقعيت هاي فراواني يافت

مي شود كه در آنها دو يا چند متغير وجود دارد و منظور از بررسي متغيرها مشخص كردن روابط موجود

بين اين متغيرهاست . بين برخي از متغيره ا رابطه مستقيم وجود دارد . هنگامي كه افزايش در يك متغير با

افزايش در متغير ديگر، يا كاهش يك متغير يا كاهش متغير ديگر همراه باشد همبستگي بين آنها مستقيم و

مثبت است (مثلاً همبستگي بين هوش و پيشرفت تحصيلي دانش آموزان). چنانچه افزايش در يك متغير با

كاهش در متغي ر ديگر همراه باشد همبستگي بين دو متغير منفي و معكوس است (مثلاً همبستگي بين سن و

قدرت حافظه افراد بزرگسال)

ضريب همبستگي 2

اندازه همبستگي بين متغيرها ضريب همبستگي ناميده مي شود. ضريب همبستگي براي اولين بار توسط

فرانسيس گالتون به شكل نمودار پديد آمد و سپس كارل پيرسون روش محاسبه آن را پيدا كرد . ضريب

همبستگي يك عدد جبري است كه علامت آن جهت همبستگي و قدرمطلق آن ميزان همبستگي را نشان

−1 ) . اين ضريب ≤ Rxy ≤ + مي دهد. مقدار ضريب همبستگي از 1- تا صفر و از صفر تا 1+ است ( 1

چنانچه 1+ يا نزديك به آن باشد همبستگي كا مل مثبت يا رابطه خيلي زياد مستقيم را مي رساند و چنانچه

-1 يا نزديك به آن باشد همبستگي كامل منفي يا خيلي زياد معكوس را معرفي مي كند اگر ضريب همبستگي

صفر و يا نزديك به آن با شد نبودن رابطه بين دو متغير را معلوم مي كند (مثلاً بين قد و اجتماعي بودن

ضريب همبستگي در حدود صفر است زيرا بلندي يا كوتاهي قد تاثيري در اجتماعي بودن ندارد).

وجود همبستگي بين متغيرها به آن معني نيست كه يك متغير علت متغير ديگر است . در آمار همبستگي به

رابطه بين دو يا چند متغير كه قابل تبديل به مقدار هستند اطلاق مي شود و معني آن اين است كه م ي توان با

را پيش بيني كرد . همبستگي رابطه بين دو متغير را در يك جامعه توصيف Y مقدار X معلوم بودن متغير

مي كند. مي توان از همبستگي براي تعيين رابطه دو متغير در گروهي از افراد و همچنين براي دو گروه

1- Correlation

2- Correlation Coefficient

فصل هفتم

احتمالات

1 تئوري احتمالات و مفهوم احتمال

مقادير آماري كه از يك گروه نمونه بدست مي آيند شاخصهاي توصيفي بشمار مي روند . به وسيله اين

شاخصها، داده هاي تجربي را بطور خلاصه بيان مي كنيم. به عنوان مثال ميزان تصادف يك پديده را كه

چند بار تجربه كرده ايم با يك شاخص مقدار متوسط (ميانگين، ميانه و يا نما ) نشان مي دهيم و يا

پراكندگي هائي را كه در اين پديده مشاهده كرده ايم با يك شاخص تغييرپذيري (دامنه تغيير، دامنه دهكها و

صدكها، انحراف متوسط از ميانگين و يا واريانس و انحراف استاندارد ) اندازه گيري مي كنيم و بالاخره

رابطه اين پديده را با يك پديده وابسته ديگر به وسيله ضريب همبستگي بيان مي كنيم.

از آنجا كه اين بررسي هاي توصيفي اصولاً محدود به مواردي است كه در آنها تجربه و آزمايش بعمل

آمده است، بنابراين نتيجه آنها از كليت و اعتبار يك قاعده علمي برخوردار نيست . فايده علمي شاخصهاي

توصيفي بستگي به اين دارد كه تا چه ميزان بتوان از آنها براي بيان قواعد و روابط كلي استفاده كرد.

در آمار استنباطي پس از توصيف نتايج عيني آزمايش بايد به تحليل آن پرداخت . هدف از اين تحليل در

اصل آن است كه احتمال درست بودن محتواي شاخصهاي توصيفي معين شود . به بيان ديگر هدف هر

تحليل آماري آن است كه به نتايج يك تحقيق مشخص و محدود عموميت داده و وسيله پيشگوئي علمي در

موارد مشابه قرار گيرد . بايد بدانيم كه اطلاعاتي را كه از يك گروه نمونه بدست م ي آيد فقط با احتمال

معيني مي توان پذيرفت . بهمين سبب پايه و اس اس آمار استنباطي بر اصول احتمالات نهاده شده است . با

توجه به اين نكته، آشنائي با برخي از قوانين مقدماتي احتمالات و اصول و مفاهيم آن به ويژه براي درك

بهتر مدلهاي آماري (مانند توزيع دوجمله اي و نرمال) ضرورت دارد.

تئوري احتمالات

از آنجا كه نمي توانيم همه شرايط ي را كه پاره اي از پيشامدها به آن بستگي دارد تشخ يص دهيم، علت وقوع

اين پيشامدها و يا عدم وقوع آنها را نمي توانيم با دقت پيش بيني كنيم. به پيشامدهائي كه علت آنها بر ما

گفته مي شود. اگر بتوانيم پيشام دها را با « تصادفي » ، معلوم نيست و پي آمد آنها را نمي توان پيش بيني كرد

استفاده از قانون توجيه كنيم ديگر تصادفي نخواهند بود . بنابراين شانس و يا تصادف برحسب تعريف به

ظاهر عدم حضور قانون را مي رساند. مع الوصف بايد دانست كه پيشامدهاي تصادفي با وجود غيرقابل

پيش بيني بودن از قوانين معيني پيروي مي كنند كه در تئوري احتمالات مورد بررسي قرار مي گيرند .

فصل هشتم

توزيع و منحني طبيعي

1 مفهوم منحني طبيعي

در فصل مربوط به احتمالات وقتي كه دربارة روش تقريب منحني نرمال بحث شد اشاره مختصري به

منحني نرمال و رابطه سطح زير منحني با ميانگين و انحراف استاندارد توزيع بعمل آمد با توجه به اهميت

موضوع در اين فصل نيز بطور مبسوط به بررسي و مطالعه آن مي پردازيم.

در توزيع بهنجار بيشتر داده ها حول مركز (ميانگين) توزيع انباشته شده و هر چه به طرفين پيش رويم

بتدريج از تراكم كاسته مي شود، بهمين جهت شكل منحني توزيع، طبيعي و زنگوله اي است و اندازه ميانگين،

ميانه و نما يكسانند . اين منحني در هر دو سطح نامحدود است يعني هر اندازه كه امتداد يابد هرگز محور

ها را قطع نمي كند. مساحت زير منحني (مجموع نسبتها ) مساوي با يك است . طول منحني از ∞- تا ∞+ و X

0 است. / عرض آن در نقطه ميانگين برابر 3989

2 سطح زيرمنحني طبيعي:

تعداد كل حوادث است كه 50 درصد آن در بالا و 50 درصد ديگر N سطح كل زير منحني نرمال برا بر با

تهيه شده است σ= و 1 N= در پائين ميانگين قرار مي گيرد. با توجه به آنكه جدولهاي منحني نرمال براي 1

هاي مختلف است استفاده كنيم لازم σ و N اگر بخواهيم از اين جدولها براي پاسخ به مسائلي كه شامل

را استاندارد محاسبه كنيم . همانطوريكه قبلاً اشاره شد نمره استاندارد از σ و N است ك ه مقادير مختلف

طريق فرمول

x Sx

x

S

Z X X =

= قابل محاسبه است (اين فرمول را در مورد داده هاي منحني نرمال

σ بصورت

−μ

مي توان نوشت) Z = X

يكي از خواص عمده منحني نرمال رابطه واحد انحراف استاندارد توزيع و سطح زير منحني است بدين معني

كه سطح زير منحني با واحدهاي انحراف استاندارد به نسبتهاي ثابت و مشخصي به شرح زير تقسيم م يشود:

0) موارد يا افراد بين ميانگين و يك انحراف / 34 درصد ( 3413 / الف _ در يك توزيع نرمال حدود 13

استاندارد بالا (و يا پائين) ميانگين قرار مي گيرند.

(μ → ±1σ)=34/13 %

(-1σ → +1σ)=68/26 %

⎠⎟ درصد 68 بنابراين حدود

⎜⎝

3

2

موارد يا افراد در يك توزيع نرمال بين يك انحراف استاندارد زير تا يك

انحراف استاندارد بالاي ميانگين قرار دارند و به آنها افراد متوسط اطلاق مي شود.

فصل نهم

استنباط آماري

1 مفهوم استنباط آماري

مردم در جريان فعاليت هاي روزمره معمولا براساس آگاهي هاي محدود در مورد خود، ديگران و جه ان

اطراف به داوري و ارزشيابي م ي پردازند، هر چند كه ظاهرا برخورد و رفتار آنان حاكي از واقعي بودن

اطلاعات در مورد جامعه مور د نظر است ولي از نظر عيني و دقيق بودن، اطلاعات مورد نظر ممكن است

مبين خصوصيات اصلي جامعه بوده و بنابراين معتبر باشند و يا فاقد ويژگيهاي جامعه اصلي بوده و

درنتيجه فاقد اعتبار تلقي شوند . آماردانان و محققان علوم رفتاري بمنظور استنباط صحيح و معتبر

خصوصيات جامع ه موردنظر، سعي مي كنند نمونه مورد مطالعه هر چه بيشتر معرف جامعه تعريف شده

باشد. به همين جهت آنان در پژوهش هاي خود از مدلهاي استنباط آماري خاصي تبعيت مي كنند.

در مدل استنباط آماري چنين فرض مي شود كه مي خواهيم در مورد يك مجموعه خيلي وسيع كسب

اطلاعات كنيم (مثلا نمره پيشرفت تحصيلي درس علوم تجربي دانش آموزان كلاس سوم راهنمائي در

سراسر كشور ). به اين مجموعه خيلي بزرگ جمعيت يا جامعه گفته مي شود . گاهي حجم جامعه آن قدر

بزرگ و وسيع است كه امكان مطالعه تمام آن وجود ندارد به همين جهت از اين كل، يك زير مجموعه

بعنوان نمون ه انتخاب م ي شود. اين زير مجموعه را كه شامل تعداد محدودي از اعضاء جامعه مورد نظر

است گروه نمونه آماري مي نامند.

بمنظور استنباط خصوصيات جامعه براساس خصوصيات نمونه، مدل آماري ايجاب مي كند كه افراد گروه

نمونه بصورت تصادفي انتخاب شوند . روش نمونه گيري وقتي تصادف ي است كه همه افراد جامعه به يك

اندازه، شانس انتخاب شدن و شركت در گروه نمونه آماري را داشته باشند . بعلاوه انتخاب هر فرد مستقل

از افراد ديگر صورت گيرد . محقق با فرض انتخاب تصادفي آزمودنيها يك موقعيت مناسب براي تعميم

يافته هاي حاصل از مطالعه نمونه را به دست مي آورد.

براي استنباط در مورد يك جامعه بايد خصوصيات مربوط به آن (مقادير متوسط و يا پراكندگي ) با

استفاده از خصوصيات گروه نمونه توصيف شود . در آمار به مقاديري كه خصوصيات جامعه را توصيف

مي كند پارامتر گويند بنابراين به اندازه ميانگين، واريانس، انحراف معيار و ... جامعه پارامتر اطلاق مي شود

و متقابلا به مقاديري كه خصوصيات گروه نمونه را بيان مي كنند (نظير ميانگين، واريانس و انحراف معيار )

شاخص آماري و يا آماره گفته مي شود. بمنظور تميز بين مفهوم پارامتر و شاخصهاي آماري معمولا

فصل دهم

آزمون هاي آماري پارامتريك

1 آزمون هاي آماري و انواع آنها

از ميان همه دانشجويان دانشگاههاي n= هرگاه تعداد زيادي از پژوهشگران نمونه هائي با حجم مثلا 50

ايران انتخاب و قد را آنها اندازه گيري كنند ميانگين قد نمونه هاي منتخب با هم مساوي نخواهند بود. ميانگين

قد بعضي از نمونه ها نسبتاً زياد و برخي ديگر نسبتاً كم است اما ميانگين بيشتر نمونه ها حول ميانگين

جامعه انباشته خواهد شد . اين تغييرپذيري در ميانگين ها از خطاي نمونه گيري ناشي مي شود كه صرفاً

بيانگر تغييرپذيري تصادفي است كه بطور اجتناب ناپذيري در م حاسبه ميانگين بعضي از نمونه ها تاثير

مي گذارد. بهمين جهت پذيرفتن اين فرض كه ميانگين هر يك از نمونه ها احتمالاً با ميانگين جامعه تفاوت

دارد منطقي خواهد بو د. از آنجا كه استنباط آمارشناسان از جامعه تنها بر خصائص يك نمونه استوار

است بنابراين تغييرپذيري ميانگين نمونه ها ظاهراً به صورت يك مشكل جدي به نظر مي رسد . اما چون

ماهيت آنها مشخص است برآورد تغييرپذيري ميانگين نمونه ها براساس احتمالات از طريق اجراي

آزمون هاي آماري امكان پذير خواهد بود.

آزمون هاي آماري روش هائي هستند كه بمنظور بررسي ميزان دقت و اعتبار داد ه هاي آماري و يا به بيان

ديگر تعيين ميزان تاثير خطاي نمونه گيري در برآورد پارامتر جامعه براساس شاخص هاي آماري نمونه

بكار مي روند و بطور كلي بر دو گونه اند : پارامتر يك و ناپارامتر يك . در اين فصل به توضيح انواع

آزمونهاي پارامتر يك و موارد كاربردي آنها مي پردازيم.

2 آزمون هاي پارامتريك و پيش فرضهاي مربوط به آن

آزمون هاي پارامتري را مي توان موثرترين آزمون ها دانست كه در غالب موارد در تعميم نتايج حاصل از

گروه نمونه به جامعه آماري مورد استفاده قرار مي گيرند. مشروط بر اينكه پيش فرض هاي زير در مورد

آنها رعايت شود:

1 هر يك از موارد مشاهده شده مستقل است . يعني انتخاب يك مورد به انتخاب هيچ مورد ديگري وابسته

نيست.

2 واريانس نمونه ها برابر يا تقريباً برابر است . رعايت اين نكته در نمونه هاي با حجم كم اهميت بيشتري

دارد.

3 توصيف متغيرها براساس مقياس هاي نسبي و يا فاصله اي انجام مي گيرد.

فصل يازدهم

آزمون هاي ناپارامتريك

تحت عنوان آزمون هاي پارامتري مورد بحث قرار گرفتند و ديديم كه اين F و t ، Z قبلاً آزمون هاي

آزمون ها بر طبيعي بودن توزيع متغير در جامعه مبتني هستند و بعلاوه داده هاي مربوط به آنها از نوع

پيوسته و منظم بوده و به عبارت ديگر داراي مقياس اندازه گيري نسبي و يا فاصل هاي م يباشند.

گاهي در پژوهش ها داده هائي جمع آوري مي شوند كه داراي مقياس اسمي يا رتبه اي هستند و يا ممكن است

داده ها داراي مقياس فاصله اي باشند ولي توزيع داده ها در جامعه طبيعي نيست در چنين مواردي

پژوهشگر ملزم به اس تفاده از آزمونهاي غير پارامتريك است . اين آزمونها در كليه مواردي كه پژوهشگر

نمي تواند از آزمونهاي پارامتريك استفاده كند ابزار مناسبي براي آزمون فرضيه ها هستند بطور كلي

مي توان گفت كه اين آزمونها در مورد داده هائي به كار مي روند كه:

1 مقياس اندازه گيري آنها اسمي و يا رتبه اي باشد (از نوع داده هاي ناپيوسته و يا منفصل و بنابراين

حاصل شمارش هستند).

2 بر نرمال بودن توزيع در جامعه استوار نيستند.

مهمترين آزمون هاي ناپارامتري عبارتند از:

χ 1 آزمون مجذور كاي (مجذور خي) 2

2 آزمون نسبت ها و درصدها

3 آزمون ميانه

مان وتيني U 4 آزمون

5 آزمون نشانه

6 آزمون رتبه هاي علامت دار ويل كاكسون

(H) 7 آزمون كروسكال واليس

8 آزمون كالموگروف اسميرنف

اينك به توضيح هر يك از اين آزمون ها مي پردازيم:

فصل دوازدهم

رگرسيون و پيش بيني

1 مفهوم رگرسيون

با استفاده از Y رابطه وجود داشته باشد، مي توان نمره فردي را در متغير Y و X هرگاه بين دو متغير

با ميزان موفقيت (X) برآورد يا پيش بيني كرد. به عنوان مثال چنانچه هوش يك دانش آموز X متغير

همبستگ ي مثبت داشته باشد، مي توان پيش بيني كرد كه دانشجوئي كه نمره هوشي او از (Y) تحصيلي او

حد متوسط بالاتر است در دوره تحصيل نيز موفقيت تحصيلي و پيشرفت درسي او از ميانگين بالاتر

خواهد بود . در اين مثال از نمره هوشي به عنوان يك متغير پيش بيني كننده براي برآورد ميزان موفقيت

تحصيلي استفاده شده است . هر چه شدت همبستگي دو متغير بيشتر باشد، دقت پيش بيني نيز افزايش پيدا

مي كند. اگر همبستگي دو متغير كامل ( 1 ±) باشد در آن صورت پيش بيني كامل و دقيق امكا ن پذير خواهد

بود.

: (Z) 2 پيش بيني نمر ههاي تراز شده

روش پيش بيني كردن نمره هاي تراز ش ده ابتدائي ترين روشي است كه با استفاده از ضريب همبستگي

و متغيري را (Y) پيرسون براي پيش بيني به كار برده م ي شود. متغيري را كه مي خواهيم پيش بيني كنيم با

نشان مي دهيم . در اين روش بين متغيرها و ضريب (X) كه پيش بيني از طريق آن صورت مي گيرد با

12 ) برقرار است. _ همبستگي آنها رابطه ( 1

ZY = (ZX) (rXY) (12_1)

0 و نمره تراز شده / برابر 50 (Y) و آمار (X) مثال: اگر ضريب همبستگي بين نمرات درس رياضي

باشد نمره تراز شده آمار او برابر است با: ZX = +1/ رياضي دانش آموزي 60

ZY = 1/ 60 ×0/ 50 = +0/ 80

را. X را پيش بيني كرد و هم نمره تراز شده Y تبصره: از فرمول مذكور مي توان هم نمره تراز شده

3 رگرسيون به طرف ميانگين

اگر بين متغيرها همبستگي كامل نباشد، پيش بيني دقيق امكان پذير نخواهد بود، زيرا در چنين شرايطي

نمره هاي پيش بيني شده به طرف ميانگين نمره گرايش پيدا مي كنن د. اين پديده تاثير رگرسيون ناميده

مي شود و چون غالباً رگرسيون به طرف ميانگين دومين متغير است آنرا رگرسيون در اطراف ميانگين

آمار توصيفي و استنباطي 􀀟 366

-1 پديده رگرسيون تحت كدا ميك از حال تهاي زير، به طور كامل اتفاق م يافتد؟

r = +1 (4 r = 0/ 50 (3 r = 􀁄 (2 r = −1 (1

-2 در يك توزيع غيرنرمال، براي محاسبه ميزان پراكندگي، كدام شاخص مناسب تر است؟

1) واريانس 2) تفاضل چارك ها 3) انحراف چاركي 4) انحراف استاندارد

-3 چنانچه در يك نمونه 25 نفري، مقدار ميانگين نمونه از پارامتر بيشتر و فرضيه صفر رد شده

باشد، كدام رابطه درست است؟

tob ≥ tα (4 Zob > tα (3 Zob ≥ Zα (2 Zob > Zα (1

-4 اگر دو متغير داراي توزيع نرمال بوده ولي نمرات آنها فقط به صورت دو مقول ه اي (صفر و ي ك )

در دسترس باشد، با كدام روش همبستگي م ي توان ميزان ارتباط اين دو متغير را به درستي

سنجيد؟

1) تتراكوريك 2) رتبه اي 3) پيرسون 4) في

-5

2

3

قرار مي گيرند؟ (Z) از مساحت زير منحني نرمال در كدام دامنه نمرات استاندارد

(− 2 , 2) (1

3 3

(−1,1) (4 (−2,2) (3 (−3,3) (2

-6 خطاي طبق هبندي هنگامي بيشتر م يشود كه فاصله طبقات ............ و تعداد طبقات نيز ............ باشد.

1) زياد - كم 2) كم - زياد 3) زياد - زياد 4) كم - كم

-7 انحراف استاندارد بر كدام ويژگي يا شاخص توزيع فراواني تأثير دارد؟

1) كجي 2) نما 3) ميانگين 4) كشيدگي

حاصل مي شود؟ n1 + n2 − -8 در كدام آزمون آماري، مقدار درجه آزادي از طريق 2

1) مقايسه دو ميانگين همبسته 2) مقايسه دو ميانگين مستقل

3) مقايسه ميانگين با يك ارزش ثابت 4) آزمون آماري دو نسبت

تبديل كرده ايم. نمره Z -9 نمرات 30 دانش آموز را در دو درس تعيين و آنها را به نمر ه ي استاندارد

دانش آموزان در هر دو امتحان دقيقاً برابر شده است. ضريب همبستگي دو توزيع كدام است؟ Z

1) صفر

+0/50 (2

+1 (3

4) بدون داشتن نمرات و انجام محاسبه، تعيين آن ميسر نيست.

تست هاي علوم تربيتي 1 و 2 و روانشناسي سراسري 1388

جداول ضميمه

نمودارها و مفاهيم نزديك به توزيع تك متغيري

به نام خدا

  نام و نام خانوادگی:حسین چهارباشلو                                                                          تاریخ:  24/7/1391

  در توزیع تک متغیری با چه سوالاتی روبرو هستیم؟ توضیح تفضیلی.

پاسخ 

با توجه به اینکه هدف توزیع‏های تک متغیری اینست که تغییرات متغیرها را بطور جداگانه در جامعه معینی توصیف کند، باید وضعیت جامعه را نسبت به آن متغیر بدانیم. بنابراین باید به سوالات زیر پاسخ دهیم:


1- الگوی کلی داده ها چگونه است؟(جدول و نمودار)

جدول توزیع فراوانی:

یکی از کارآمدترین روشها برای خلاصه و سازمان بندی کردن اطلاعات جدول توزیع فراوانی می باشد.توزیع فراوانی عبارت است از سازمان دادن به اندازه ها یا مشاهده ها به وسیله در آوردن آنها در قاب طبقه ها همراه با ذکر فراوانی هر طبقه.یکی از نقاط ضعف نمایش داده ها به وسیله جدول فراوانی این است که اطلاعات جدول رو نمی توان به سرعت درک کرد.بنابراین به منظور دریافت تصویر روشن تری از داده های جمع آوری شده از نمودار استفاده می شود.

نمودار و انواع آن:

نمودار ابزاری تصویری است که برای توصیف و نمایش داده های جمع آوری شده به کار برده می شود.پس از سازمان بندی کردن داده ها در جدول توزیع فراوانی،غالبا نمایش آن ها به وسیله نمودار به پژوهشگر کمک می کند تا ویژگیهای داده ها را بهتر و آسان تر توصیف کند.

برای بررسی نمایش گرافیکی داده ها بصورت نمودار می توانیم از نمودارهای زیر استفاده کنیم: 

نمودار ستونی

رایج‌ترین نوع نمودارها، نمودار ستونی افقی یا عمودی است که از نظر خواندن، ساده‌ترین نوع نمودار است. تهیه این نوع نمودار نیز بسیار آسان است، به این ترتیب که هر دسته از اطلاعات را در یک ستون قرار می‌دهیم. از نمودار ستونی بیشتر برای مقایسه استفاده می شود که ستون‌ها را با گذاشتن فاصله‌هایی میان آنها از هم جدا می‌کنند. این ستون‌ها یا همگی افقی هستند یا عمودی، برای مقایسه اجزاء تشکیل‌دهنده یک کمیت در یک زمان معین از ستون‌های افقی استفاده می‌شود و برای مقایسه اجزا در زمان‌های مختلف ستون‌های عمودی به کار می‌رود.به دیگر سخن،از این نمودار زمانی استفاده می شود که داده های جمع آوری شده به متغیرهای گسسته تعلق داشته باشند و با استفاده از مقیاس اسمی اندازه گیری شده باشند.

نمودار خطی

هنگامی که داده‏ها به صورت پیوسته باشد باید از نمودارهای خطی استفاده کرد. ساده ترین نوع نمودار می‏باشند.همچنین در نشان دادن ارتباط میان دو سری اطلاعات بسیار مفید هستند. هنگامی از این نوع استفاده می‌شود که اطلاعات بسیار زیادی در دست باشد. در این نمودار تنظیم اعداد بر روی محور افقی از چپ به راست و بر روی محور عمودی از پایین به بالا صورت می‌گیرد و همواره باید نقطه صفر مشخص شود و مقیاس فواصل مساوی باشد. برای رسم نمودارهای خطی می‌توان از کاغذهای شطرنجی استفاده کرد. محور افقی در این نمودار معمولاً اندازه‌های متغیر مستقل و محور عمودی صفت اندازه‌گیری شده را نشان می‌دهد.

نمودار دایره‌ای

یکی دیگر از نمودارهایی که اطلاعات موجود را به سرعت در معرض دید قرار می‌دهد نمودار دایره‌ای است. در این نوع نمودار شعاع‌های دایره به طور عمودی کشیده می‌شوند و بخش‌های تشکیل‌دهنده نمودار در جهت حرکت عقربه ساعت از بزرگ به کوچک تنظیم می‌شود. در یک دایره ۳۶۰ درجه‌ای نسبت عددها، برحسب تعداد درجه‌های هریک از بخش‌های نمودار مشخص می‌شود. نمودار دایره‌ای ساده‌ترین و در عین حال مناسب‌ترین روش برای مقایسه و نمایش داده‌های جمع‌آوری شده از متغیرهای گسسته است.

نمودار تصویری

در نمودار تصویری از انواع شکل‌های سیاه و سفید یا رنگی استفاده می‌شود و بدین ترتیب حالت حقیقی و جذاب به نمودار داده می‌شود. این نوع نمودار در حقیقت از نمودار ستونی گرفته شده است و در واقع همان اطلاعات را نیز ارائه می‌دهد. نمودار مصور به سادگی قابل خواندن است و این مزیت را دارد که شکل‌های حقیقی در آن مورد استفاده قرار می‌گیرند.

هیستوگرام

نمودار هیستوگرام همانند نمودار ستونی است و تنها تفاوتی که وجود دارد، نمایش ستون‌هاست. در هیستوگرام ستون‌ها به یکدیگر چسبیده‌اند. اتصال ستون‌ها در هیستوگرام موجب می‌شود تا این نمودار وسیله مناسبی برای نمایش داده‌های ناشی از اجرای متغیرهای پیوسته باشد، متغیرهایی که با استفاده از مقیاس‌های فاصله‌ای و نسبی مورد اندازه‌گیری قرار می‌گیرند.در هیستو گرام هر ستون نشان دهنده یک طبقه از اعداد است.عرض هر ستون برابر فاصله طبقه و ارتفاع آن مساوی فراوانی همان طبقه است.

نمودار چندبر(چند ضلعی)

اگر بخواهیم متغیرهای کمی پیوسته را به صورت دقیقی نشان دهیم از نمودار چندبر فراوانی استفاده می کنیم.نمودار چند ضلعی کاربرد فراوانی دارد.دلیل این امر هم سهولت ساختن و توصیف آن است.برای رسم این نوع از نمودارها مرکز دسته را روی محور افقی x و فراوانی داده ها را روی محور عمودی به عنوان y در نظر می‏گیریم و با وصل کردن این نقاط به هم نمودار چندبر فراوانی بدست می آید.در نمودار چند ضلعی،طول محورهایx و y معمولا به نسبت 3 به 2 یا 4 به 3 ترسیم می شود.غالبا در ابتدا و پایان محور افقی دو طبقه در نظر گرفته می شود که فراوانی آنها صفر است،یعنی هیچ نمره ای در این طبقات واقع نشده است.اضافه کردن آنها فقط به خاطر آن است که شروع و خاتمه چند ضلعی به محور افقی ختم شود.دلیل عمده ترسیم نمودارهای چند ضلعی و هیستو گرام این است که آنها نحوه توزیع نمره ها را در روی مقیاس نمره ها نشان می دهند.به این معنی که آنها شکل توزیع نمره ها را مجسم می سازند.

نمودار چند ضلعی تراکمی(اجایو):

این نمودار وقتی مفید است که پژوهشگر علاقه مند باشد وضعیت یک نمره یا یک فرد را نسبت به بقیه نمره ها یا افراد مشخص باشد.به عنوان مثال  پژوهشگری می خواهد تعیین کند که نمره ای از چند درصد نمره ها بیشتر یا کمتر است.

نمودار جعبه‌اي (Box and Whisker Plot):

زماني‌ كه‌ هدف‌ تاكيد بر نقاط‌ مشخصي‌ از توزيع‌ باشد از اين‌ نمودار براي‌ ارائه‌ اطلاعات‌ استفاده‌ مي‏گردد. این نمودار انجام‌ مقايسه‌ بين‌ چند مجموعه‌ داده‌ را به‌ آساني‌ امكان‌ پذيرمي‌سازد. نمودار جعبه‌اي با استفاده از يك مستطيل (باكس) در دو خط در دو طرف مستطيل (ويسكر) و به وسيله ميانه، چارك هاي اول و سوم و كمترين و بيشترين اندازه مشاهده شده رسم مي شود. با استفاده از اين نمودار مي‏توان مركزيت،‌ پراكندگي و چولگي داده ها را تفسير نمود.

روش‌ ترسيم‌ :

1. داده ها را به صورت صعودی مرتب می کنیم.

2. میانه داده ها را مشخص می کنیم. 

3. چارک اول و سوم را مشخص می کنیم. 

4. یک خط افقی مدرج که بتوان همه داده ها را روی آن نشان داد رسم می کنیم. 

5. مکان کوچک ترین عدد مشاهده شده، بزرگ ترین عدد، میانه، چارک اول و چارک سوم را تعیین می کنیم. 

6. بالای خط مدرج رسم شده مستطیلی رسم می کنیم که طول آن برابر با Q3- Q1 (برد چارک ها) بوده و از نقطه Q1 شروع و به نقطه Q3 ختم شود و عرض این مستطیل به اندازه معقول در نظر گرفته می شود. اندازه میاننه را به صورت خطی به موازات عرض مستطیل رسم نموده و مستطیل را به وسیله یک خط منقطع به موازات خط مدرج شده به دو قسمت تقسیم می کنیم. 

7. مرزهای داخلی و خارجی داده ها را با توجه به روابطی خاص تعیین می کنیم.

8. با استفاده از داده های مرتب شده، دو اندازه کوچک ترین و بزرگ ترین داده را که داخل مرزهای داخلی قرار دارند، تعیین کرده و خط منقطع وسط مستطیل را تا این دو نقطه به صورت خط پر ادامه می دهیم. این خطوط را ویسکر می نامند که از چارک ها شروع و به نقاط فوق ختم می شوند.

هر عددي كه خارج از مرزهاي داخلي قرار گرفته باشد را يك داد پرت ناميده و چنانچه بين مرزهاي داخلي و خارجي قرار گيرد، آن را داده پرت ضعيف ناميده و با علامت ○ نشان مي دهيم و چنانچه خارج از مرزهاي خارجي قرار گیرد آن را داده پرت قوي که بعضی به آن داده انتهایی نیز می گویند و با علامت ● نشان مي دهيم.

 

با استفاده از نمودار باكس - ويسكر مي توان اطلاعات زير را در مورد داده ها كسب نمود:

الف) اگر ميانه نزديك وسط مستطيل (باكس) باشد توزيع داده ها تقريبا متقارن است.

ب) اگر ميانه در طرف چپ وسط مستطيل باشد توزيع چوله به راست و اگر ميانه در طرف راست وسط مستطيل قرار گيرد توزيع چوله به چپ است.

ج) اگر خطوط دو طرف مستطيل (ويسكرها) تقريباً برابر باشند توزيع داده ها به توزيع متقارن نزديك بوده و در صورت نامساوي بوده خطوط توزيع داراي چولگي است.

د) در مقايسه نمودار باكس - ويسكر دو مجموعه از داده ها مي توان پراكندگي آنها را با توجه به طول مستطيل هاي نمودار با يكديگر مقايسه نمود. مستطيلي كه طول بزرگتري دارد داراي پراكندگي بيشتر مي باشد.

ه) داده هاي پرت ضعيف و داده هاي پرت قوي را با استفاده از نمودار باكس - ويسكر مي توان تعيين نمود.

نمودار شاخه و برگ

این نمودار نیز براي توصيف داده هاي كمي به كاربرده مي‏شود. رسم نمودار شاخه و برگ به دليل از دست ندادن اطلاعات، به نمودارهاي فراواني ترجيح داده مي شود. هر داده یک ساقه و یک برگ دارد. معمولا برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند . برای مثال در عدد 317 عدد 7 برگ و 31 ساقه است. يك‌ نمودار منعكس‌ كننده‌ توزيع‌ فراواني‌ و هيستوگرام‌ است‌ و ضمن‌ نشان‌ دادن‌ شكل‌ هيستوگرام‌، داده‌ هاي‌ اصلي‌ را نيز نشان‌ مي‏دهد. در این نمودار بجاي رسم ميله‌ها، فراواني‌ها به شكل اعداد (با نمايش تعداد تكرار و بيان اعداد مشاهده شده) نشان داده می شوند.

روش ترسیم:

1. هر داده  به دو قسمت تقسیم می شود. یک قسمت از داده  ساقه و قسمت دیگر برگ است. برگ، آخرین رقم داده بوده و بقیه ساقه آن را تشکیل می دهند. 

2. ساقه ها به ترتیب از کوچک به بزرگ مرتب می شوند. 

3. هر برگ به ساقه مناسب اضافه می شود.

با مقايسه نمودار نمودار شاخه و برگ و نمودار هيستوگرام ديده مي‌شود كه در نمودار هيستوگرام با ايجاد طبقات ديگر دستيابي به مقادير انفرادي مشاهدات امكان پذير نيست اما در نمودار شاخه و برگ ضمن داشتن ايده تصويري از نحوه توزيع داده ها به يكايك اطلاعات نيز دسترسي داريم.

نمودار میله ای

براي داده هاي كمي گسسته، وقتيكه از رده ها استفاده مي شود، نمودار ميله‌اي مناسب ترين نمودار است كه همانند داده هاي كيفي رسم مي شود، با اين تفاوت كه به جاي گروههاي مختلف داده كيفي از رده ها در محور افقي استفاده مي شود.

نمودار چند گوش:؟؟

 این نمودارها برای نمایش داده های کمی گسسته به کار می روند.


نمودار راداري ( Radar Chart) :

نوعي از نمودار خطي است. با اين تفاوت که نمودار مزبور بجاي اينکه نسبت به محور ترسيم شود، نسبت به يک نقطه مرکزي ترسيم مي شود. يعني خط افقي در نمودار خطي ، در نمودار راداري بصورت دايره نشان داده مي‏شود.

به نمودار راداری نمودار تار عنکبوتی یا گراف ستاره ای نیز گفته می شود که بیشتر به منظور نمایش مشاهدات چند متغیره استفاده می‏شود. یک نمودار راداری شامل مجموعه ای از پره (محور) های متساوی الزاویه بوده که هر یک بیان کننده یک متغیر می باشد. یک داده از یک متغیر بر روی محور مربوطه چنان نگاشته می شود که فاصله آن از مرکز نسبت به طول محور برابر با مقدار آن متغیر نسبت به بیشینه مقدار ممکن متغیر باشد. خطوطی نقاط مجاور را به یکدیگر متصل کرده و نهایتاً یک چند ضلعی مشخص حاصل از مشاهدات بدست می آید. بنابراین نمودار راداری تنها با یک چند ضلعی به محقق کمک کرده تا متغیر (متغیرهای) غالب را برای یک سری مشاهدات تشخیص دهد. 

نمودار پراكنش

ارائه داده هاي دو متغيره كمي بوسيله نمودار پراكنش در بسياري از مطالعات با ثبت دو صفت كمي به دنبال يافتن رابطه بين دو صفت براي واحدهاي مطالعاتي مي باشيم. اگر مقادير دو صفت را با x و y نمايش دهيم آنگاه براي هر كدام از مشاهدات يك زوج مشاهده داريم. با رسم اين زوج مشاهدات در محورهاي مختصات، نمودار حاصل را نمودار پراكنش مي‌نامند.


2- حد متوسط  عملکرد گروه چگونه است؟

برای پاسخ به این سوال باید شاخص های مرکزیت (میانگین، میانه، نما) داده ها را مشخص کنیم.

شاخص های مرکزی یا گرایش به مرکز شاخص هایی هستندکه با استفاده ازآنها مجموعه ای ازداده ها در یک مقدار یا عدد که نماینده ی آن مجموعه است خلاصه می شود .به دیگر سخن،این شاخص حد متوسط رانشان می دهد و نماینده مجموعه ی از اعداد هستند.نما و میانه و میانگین (mean, median, mode) سه شاخص مرکزی هستند.

نما mode:

 ساده ترین شاخص گرایش مرکزی است، نما عددی است که دارای بیشترین فراوانی است. عددی که دارای بیشترین فراوانی است،اغلب نزدیک به مرکز توزیع فراوانی قرار دارد. درچنین شرایطی نما یک شاخص مرکزی است. اما نما همیشه در مرکز توزیع فراوانی قرار ندارد، به همین دلیل نمی توان به عنوان یک شاخص مرکزی به آن اطمینان داشت. در میان شاخص های گرایش به مرکزیت نما شاخصی بی ثبات است. به توزیع فراوانی که فقط یک نما دارد، یک نمایی و به توزیعی که دونما دارد، توزیع دونمایی می گویند و به توزیع بیش از دونما، توزیع چند نمایی گفته می شود. از نما هنگامی استفاده می کنیم که مقیاس اندازه گیری اسمی باشد و یک برآورد تقریبی از ارزش های مرکزی کفایت کند.به عبارتی دیگر،نما به عنوان یک شاخص مرکزی مورد استفاده محدودی دارد.نما مخصوصا در گروه های کوچک دارای اعتبار نیست.زیرا میزان آن فقط تابع چند عدد است.پژوهشگران معمولا هنگامی از نما استفاده می کنند که مایل باشند بینش کلی درباره شاخص مرکزی به دست آورند.این شاخص درباره گرایش مرکزی تزیع نمره ها اطلاعی به ما نمی دهد.زیرا شاخص مرکزی یک توزیع الزاما عدد با ارزشی نیست که دارای بیشترین فراوانی باشد.

میانه median :

میانه نقطه وسط یک توزیع است. هنگامی که نمرات توزیع فراوانی به ترتیب از بالاترین به پایین ترین نمره مرتب شود، نصف نمرات بالای میانه و نصف نمرات پایین میانه قرار می‏گیرد، بنابراین میانه نقطه 50درصدی است. اندازه یا حجم واحدهای اندازه‏گیری در میانه تاثیر ندارد. ثبات آن از میانگین کمتر ولی از نما بیشتراست. میانه با مقیاس های ترتیبی، فاصله ای و نسبی به کاربرده می شود.ویژگی اصلی میانه این است نسبت به اعداد کوچک و بزرگ حساس نیست.

میانگین mean :

معتبرترین شاخص گرایش مرکزی میانگین است.میانگین معدل حسابی گروهی از نمرات است که از طریق جمع کردن تمام نمرات و تقسیم حاصل جمع بر تعداد کل نمرات به دست می آید. از ویژگی های عمده میانگین این است که این شاخص نسبت به تک تک اعداد توزیع  فراوانی حساس است.اگر میانگین را ضربدر تک تک اعداد کنیم مجموع آن بدست می آید.همچنین میانگین مرکز ثقل داده هاست.یعنی مجموع نمرات انحرافی همیشه صفر است. یکی دیگر از ویژگی های میانگین این است که میانگین، نقطه ای از توزیع نمرات است که همیشه مجموع مجذور در انحراف نمرات از میانگین کوچکتر یا مساوی با مجموع مجذور در انحراف نمرات از هر عددی دیگر است. همچنین با مقیاس های فاصله ای و نسبی به کار برده می شود، و به استفاده کنندگان خود اجازه عملیات ریاضی رو می دهد،به همین دلیل مورد استفاده زیادی در آمار استنباطی دارد. و انواع مختلفی دارد.

3- داده ها حول این حد متوسط چقدر از یکدیگر فاصله دارند؟

پژوهشگر برای توصیف کامل توزیع نمره ها علاوه بر شاخصهای مرکزی،به پراکندگی نمره ها نیز نیاز دارد.به دیگر سخن،برای یک مجموعه داده ها،علاوه بر شاخص گرایش به مرکز،شاخصهای دیگر وجود دارند به نام شاخص های پراکندگی؛در واقع بیانگر فاصله،تغییرات،پراکندگی و انحرافات را نشان می دهند.شاخص های پراکندگی میزان پراکندگی یا تفسیر نمره‏ها را درمجموعه‏ای از نمرات نشان می‏دهند.دامنه ی تغییرات،انحراف چارکی،انحراف متوسط،واریانس و انحراف معیار شاخصهایی هستند که به منظور پراکندگی نمره ها به کار برده می شوند.افزون بر این،وجود یا عدم پراکندگی ضرورتا نه خوب است نه بد.قضاوت در این مورد با توجه به هدف پژوهش صورت می گیرد.

دامنه ی تغییرات:

ساده ترین شاخص پراکندگی دامنه‏ی تغییرات است که دریک توزیع فراوانی عبارتست از تفاضل بزرگترین وکوچکترین نمره، درواقع دامنه ی تغییرات یک شاخص پایدار پراکندگی نیست، زیرا مقدار آن با تغیر یک نمره (بزرگترین وکوچکترین) تغییر می‏کند. استفاده ازدامنه‏ی تغیرات مستلزم داشتن مقیاس فاصله‏ای است.دامنه تغیرات بی ثبات ترین و بی اعتبار ترین شاخص پراکندگی است.چون در محاسبه دامنه تغییرات فقط دو عدد مورد استفاده قرار می گیرد.به علاوه،چون که دامنه تغییرات بر اساس بزرگترین و کوچکترین نمره ای توزیع محاسبه می شود،بنابراین مقدار آن در نمونه های مختلفی که از یک جامعه انتخاب شود،تفاوت خیلی زیادی خواهد داشت.عیب دیگر دامنه ی تغییرات این است که مقدار آن به حجم نمونه بستگی دارد.به طور کلی،هر چه حجم نمونه زیاد باشد،مقدار دامنه تغیرات احتمالا زیاد خواهد شد.

انحراف چارکی:

جزء شاخصهای که معروف به چند دهکها مربوط می شوند.و با دو نقطه-25./. و 75./.- سرو کار دارد.این شاخص پایدارتر از دامنه‏ی تغییرات است و مساوی است با نصف تفاضل بین چارک سوم و اول. انحراف چارکی مانند میانه تحت تاثیر نمره های خیلی بزرگ یا خیلی کوچک قرار نمی گیرد. از انحراف چارکی زمانی استفاده می شود که مقیاس اندازه‏گیری حداقل فاصله‏ای باشد.هنگامی که میانه مناسب ترین شاخص مرکزی توزیع نمره ها باشد می توان از انحراف چارکی برای محاسبه پراکندگی استفاده کرد.هنگامی که نمودار نمره ها دارای کجی باشد،انحراف چارکی شاخص مناسبی برای نشان دادن پراکندگی است.

انحراف متوسط:

در آمار فاصله بین هر عدد از یکی از شاخصهای مرکزی،انحراف نامیده می شود. میانگین قدر مطلق انحرافات از میانگین را نیز انحراف متوسط گویند.به زبان ساده،انحراف متوسط،میانگین مجموع قدر مطلق انحرافات گویند.برای استفاده از انحراف متوسط،مقیاس اندازه گیری باید حداقل فاصله ای باشد.زیرا برای تفسیر نتایج تحقیق،دانستن فاصله نمره ها از میانگین ضروری می باشد و برای محاسبه میانگین نیز،داشتن مقیاس فاصله ای ضروری است.عیب این شاخص در قدر مطلق آن است یعنی قدر مطلق اجازه عملیات آماری با این فرمول رو نمی دهد و باید آن رو مجذور کنیم.

واریانس:

قبلا گفته شد که از بین شاخصهای مرکزی،میانگین شاخص با ثبات و معتبر تری است.در صورتی که بتوانیم فاصله بین هر یک از اعداد تا میانگین را تعیین کنیم آنگاه قادر خواهیم بود تا یک شاخص پراکندگی با ثبات و معتبر را محاسبه کنیم.این روش در محاسبه واریانس و انحراف استاندارد به کار برده می شود. واریانس یک شاخص پراکندگی است که از طریق محاسبه ی انحراف نمره ها ازمیانگین محاسبه می شود. برابر است با مجذور انحراف نمره ها از میانگین(میانگین مجموع مجذور انحرافات) یا مجموع مجذور انحراف نمره ها از میانگین تقسیم برتعداد نمره ها.در محاسبه انحراف متوسط،علائم اعداد و در محاسبه انحراف چارکی،کلیه ارزشهای مقداری تمام اعداد مورد بررسی قرار نمی گیرد.برای محاسبه یک شاخص پراکندگی باثبات و معتبر باید از ارزشهای عددی کلیه نمره ها استفاده کرد.در مجموع،با مجذور کردن انحراف نمره ها از میانگین،واحد واریانس یا واحد اندازه گیری تغییر پیدا خواهد کرد که نقطه ی ضعف واریانس است که با جذر واریانس مشکل حل خواهد شد.

انحراف استاندارد (انحراف معیار) :

مشکل اختلاف واحد اندازه‏گیری با واریانس را می‏توان با جذر گرفتن از واریانس حل کرد. این عمل موجب می‏شود که واحد شاخص محاسبه شده با واحد اندازه گیری به کاربرده شده یکسان شود و یکی از شاخص های معتبر آماری به نام انحراف استاندارد بدست آید. به عبارت دیگر جذر واریانس، انحراف استاندارد نامیده می شود. انحراف استاندارد مفیدترین و متداول ترین شاخص پراکندگی است. مفیدبودن این شاخص به این دلیل است که بااین شاخص می‏توان میزان پراکندگی هر توزیع پیوسته را برحسب واحد اندازه‏گیری نشان داد. این شاخص دقیق ترین شاخص پراکندگی است. استفاده از انحراف استاندارد مستلزم این است که مقیاس اندازه گیری به کاربرده شده  حداقل فاصله ای باشد.افزون بر این،انحراف استاندارد،شاخصی است که به منظور تعییت تغییرات یا پراکندگی توزیع نمره ها به کار برده می شود.مقدار انحراف استاندارد به تناسب تغییر در پراکندگی نمره ها تغیر می کند.در صوری که توزیع نمره ها نسبت به میانگین پراکندگی زیادی داشته باشد،مجموع مجذور انحراف نمره ها از میانگین، و در نتیجه انحراف استاندارد بزرگ خواهد شد.همچنین عکس آن هم صادق است.

4- شکل توزیع داده ها چگونه است؟

برای پاسخ به این سوال باید شکل توزیع (نرمال، کجی و کشیدگی) داده ها را مشخص کنیم.

شکل توزیع به سه صورت است:

نرمال یا متقارن: در منحنی نرمال در حالت تقارن مد، میانه و میانگین برابر است.

کجی (Skewness) :کجی یعنی انحراف یک منحنی از حالت تقارن.کجی به سه صورت است،در حالتی کجی صفر است که منحنی متقارن باشد.در توزیعهای متقارن فاصله بین چارک اول تا میانه با فاصله بین چارک سوم تا میانه مساوی است. در حالت کجی منفی مد بزرگتر از میانه و میانه بزرگتر از میانگین است(بیانگر این است که افراد زیادی نمره ی بالایی گرفته اند و بنابراین امتحان ساده بوده است). در حالت کجی مثبت نیز میانگین بزرگتر از میانه و میانه بزرگتر از مد است(یعنی آزمون دشوار بوده است).

کشیدگی:هنگامی که مقدار کشیدگی برابر صفر باشد توزیع نمره ها طبیعی است یعنی در شکل توزیع که بلند و رو به بالاست، نمرات نزدیک به هم یا یکسان می باشند و واریانس کم است.در صورتی که کشیدگی مثبت باشد برآمدگی منحنی توزیع نمره ها در نقطه اوج قرار خواهد گرفت. در شکل توزیع مسطح که کشیدگی منفی دارد، نمرات دور از هم‌ قرار دارند و واریانس زیاد است. ميزان كشيدگي يا پخي منحني فراواني را نسبت به منحني نرمال استاندارد، برجستگي آن مي نامند.

5- جایگاه داده ها نسبت به یکدیگر چگونه است؟

در واقع این سوال،روش های تفسیر نمره های خام را مورد بررسی خواهد داد.در این بحث اندازه ها یا شاخصهایی که موقعیت نسبی فرد یا عدد را در گروه یا توزیع نمره ها مشخص می کند. برای تعیین موقعیت نسبی هر یک از اعداد در توزیع نمره هایشان از شاخصهای مختلفی منجمله رتبه درصدی،رتبه نسبی و نمره های استاندارد استفاده خواهیم کرد.

رتبه درصدی:

رتبه درصددی،رتبه نسبی یک نمره از توزیع نمره ها را براساس مقیاس 100 تعیین می کند.رتبه درصدی یک نمره به ما می گوید که چند درصد نمره ها در توزیع در زیر آن نمره قرار گرفته اند.رتبه درصددی یک شاخص آماری رتبه ای است.رتبه در صورتی دارای معنی است که تعداد نمره ها در توزیع مشخص باشد.این شاخص معیاری برای تفسیر و مقایسه نمره ها در گروه یا توزیع فراهم می کند.رتبه درصددی وضعیت فرد را فقط در درون یک جامعه معین مشخص می کند و وقتی دارای معنی است که ماهیت مقایسه گروهی معلوم باشد.

نقاط درصددی:

نقاط درصددی همانند رتبه های درصدی اندازه های ترتیبی هستند.با استفاده از انها می توان تعیین کرد چه عددی توزیع را به درصددهای مختلف تقسیم می کند.بنابراین نقاط درصددی نقاطی بر روی مقیاس نمره هاست که معادل رتبه های درصدی اند.نقاط درصدی زمانی به کاربرده می شوند که پزوهشگر بخواهد از یک جامعه قسمتی یا تعدادی را انتخاب کند.به عنوان مثال ممکن است مدیر یک کارخانه از بین داوطلبان استخدام کسانی را انتخاب کند که به 30 درصدد سوالات ازمون استخدامی پاسخ صحیح داده باشند.

نمره استاندارد:

 از نمره استاندارد Z زمانی استفاده می‌کنیم که می‏خواهیم دو نمره خام را قابل مقایسه کنیم. یعنی مبدا و مقیاس نمرات را یکی می‌کنیم. به کمک این نمره مى‌توان تفاوت موجود در پراکندگى نمرات را بوسيله تقسيم انحراف هر نمره از ميانگين بر انحراف استاندارد آن نمرات رفع کرد و نمره‌‌ها را با يکديگر مقايسه نمود.به عبارتی دیگر،نمره های استاندارد ،وضعیت افراد یا نمره ها را نسبت به میانگین تعیین می کنند.نمره های استاندارد با مقیاس فاصله ای به کاربرده می شوند و همانند رتبه های درصددی به منظور تعیین موقعیت فرد در درون گروه به کار برده می شوند.افزون بر این،نمره های استاندارد مستقیما از نمره های خام به دست می آیند ب)چون با مقیاس فاصله ای به کاربرده می شوند بنابراین محاسبات ریاضی با آنها امکان پذیر است.نمره های استاندارد تعیین می کنند که یک نمره،چند انحراف استاندارد بالاتر یا پایین تر از میانگین قرار دارد. نمره های T و نه گانه هم جزء نمره های استاندارد هستند.

در پایان به عنوان ماحصل بحث می توان گفت که آمار توصیفی تک متغیری شامل نمایش گرافیکی (جدول، نمودار) و شاخص‌های عددی است که شامل شاخص‌های مرکزی، شاخص‌های پراکندگی و شکل توزیع است. اما در توزیع چند متغیری چونrelationship  متغیرها مطرح می باشد، اثر متقابل متغیرها علاوه بر اثر کلی مورد علاقه پژوهشگر می باشد.


انواع ضرايب همبستگي

    محاسبه ضرایب همبستگی تا حدود زیادی متاثر از مقیاس اندازه گیری متغیر ها است، بعنوان مثال برای متغیر­های اسمی جهت رابطه اصلا معنی ندارد، بین جنس و معدل تنها می­توان گفت که شدت وابستگی چه مقدار است اما افزایش یا کاهش جنس معنی ندارد.


  با توجه به نوع متغیر ها ضریب همبستگی می­تواند یکی از حالت­های زیر را داشته باشد.


1-   دو متغیر اسمی


2-   دو متغیر رتبه­ای


3-   دو متغیر فاصله­ای- نسبی


4-   متغیر اسمی و متغیر رتبه ای


5-   متغیر اسمی و متغیر فاصله­ای - نسبی


6-   متغیر رتبه­ای و متغیر فاصله­ای – نسبی


برای هر کدام از حالت­های بالا ضرایب همبستگی متفاوتی وجود دارند.

 کلمات کلیدی : انواع ضرایب همبستگی، ضریب همبستگی پیرسون، ضریب همبستگی اسپیرمن، ضریب همبستگی کرامر و فی، ضریب همبستگی لاندا، ضریب همبستگی تاو گودمن کروسکال، ضریب همبستگی گاما، ضریب همبستگی تاو کندال،ضریب همبستگی چند رشته­ای( polyserial correlation)، ضریب همبستگی چند حالتی(Polychoric correlation) و ...


منابع :


1. آمار ناپارامتریک،1382، سید یعقوب حسینی،  انتشارات دانشگاه علامه طباطبایی


2. website of the NC STATE UNIVERSITY, http://faculty.chass.ncsu.edu


3. A coefficient of agreement for nominal scale, 1960, Cohen J. Educat Psychol Measure; 20: 37-46


4. The polyserial correlation coefficient, 1982, U Olsson, F Drasgow, NJ Dorans - Psychometrika, Springer


5. On the Estimation of Polychoric Correlations and their Asymptotic Covariance Matrix, (1994), Joreskog, K. GPsychometrika, 59:3, 381-389.


 

تحلیل رگرسیون  از ویکی‌پدیا، دانشنامهٔ آزاد



در متن این مقاله از هیچ منبع و مأخذی نام برده نشده‌است.

شما می‌توانید با افزودن منابع برطبق اصول اثبات‌پذیری و شیوه‌نامهٔ ارجاع به منابع، به ویکی‌پدیا کمک کنید.

مطالب بی‌منبع احتمالاً در آینده حذف خواهند‌ شد.

تحلیل رگرسیونی یا تحلیل وایازش (به انگلیسی: Regression analysis) فن و تکنیکی آماری برای بررسی و مدل‌سازی ارتباط بین متغیرها است. رگرسیون تقریباً در هر زمینه‌ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیش بینی مورد نیاز است.


تحلیل رگرسیونی، یکی از پرکاربردترین روش در بین تکنیک‌های آماری است.


محتویات  [نهفتن] 

۱ تعریف لغوی

۲ تاریخچه

۳ رگرسیون کاذب

۴ شیوه‌ها

۵ محاسبه

۵.۱ نرم افزارها

۶ جستارهای وابسته

۷ منابع

تعریف لغوی [ویرایش]


واژه رگرسیون(Regression) را از لحاظ لغوی در فرهنگ لغت به معنی پسروی، برگشت و بازگشت است. اما از دید آمار و ریاضیات به مفهوم بازگشت به یک مقدار متوسط یا میانگین به کار می‌رود. بدین معنی که برخی پدیده‌ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می‌کنند.


تاریخچه [ویرایش]


در سال ۱۸۷۷ فرانسیس گالتون (به انگلیسی: Francis Galton) در مقاله‌ای که درباره بازگشت به میانگین منتشر کرده بود. اظهار داشت که متوسط قد پسران دارای پدران قد بلند، کمتر از قد پدرانشان می‌باشد. به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شده‌است. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده‌هایش مورد تأکید قرار داد. برای گالتون رگرسیون مفهومی زیست‌شناختی داشت اما کارهای او توسط کارل پیرسون (به انگلیسی: Karl Pearson) برای مفاهیم آماری توسعه داده شده. گرچه گالتون برای تأکید بر پدیده «بازگشت به سمت مقدار متوسط» از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده می‌شود.


رگرسیون کاذب [ویرایش]


رگرسیون کاذب (به انگلیسی: regression ) با فرض اینکه متغیرهای  و  مانا می‌باشد تخمین‌های ما از پارامترها و تستهای و درست می‌باشد. برای نشان دادن سازگاری تخمین‌های حداقل مربعات معمولی؛ ما از این نتایج زمانیکه اندازه نمونه افزایش می‌یابد و واریانس نمونه به واریانس جامعه همگرا می‌شود، استفاده می‌کنیم. متاسفانه وقتی سری نامانا باشد واریانس خوش تعریف نیست زیرا حول یک میانگین ثابت نوسان نمی‌کند. برای توضیح بیشتر دو متغیر  و  را در نظر بگیرید که بوسیله یک فرآیند گام تصادفی تعریف می‌شود.




که  و  دارای توزیع مستقل می‌باشد.هیچ دلیلی برای ارتباط بین  و  وجود ندارد یک محقق اگراثر  راروی  و یک جز ثابت رگرس کندو رگرسیون زیر را انجام دهد :


خط راست: 

نتایج این رگرسیون ممکن است بوسیله r^۲ بالاوخود همبستگی بالا بین باقیمانده هاو همجنین دارای ارزش معنی داری برای پارامتر  باشد. این پدیده به رگرسیون کاذب معروف است. در این گونه از موارد دو سری نامانا ارتباط کاذبی دارند به این علت که که هر دوی آنها در طول زمان تغییر می‌کنند و تابعی از زمانند. هماطور که گراجر و نی یو بلد بیان کردند در این حالت رگرسیون دارای r^۲ بالا؛ و آماره دوربین واتسون پایین خواهد بود و تستهای و  ممکن است خیلی گمراه کننده باشند. دلیل آن نیز این است که توزیع‌های آماره‌های تست‌های سنتی خیلی متفاوت از نتایجی که تحت فرض مانایی گرفته می‌شود، می‌باشد. بخصوص همانطور که فلیپس (۱۹۸۷)نشان داد؛ همانطور که اندازه نمونه افزایش می‌یابد نمی‌توان به معنی داری تخمین زن حداقل مربعات معمولی وآماره‌های تست‌های و  و آماره دوربین واتسون اعتماد کرد. دلیل آن این است که  و  متغیر‌های  می‌باشد و جر خطا نیزیک متغیرنامانامی‌باشد.


اگر ارزش‌های گذشته هر دو متغیر وابسته و مستقل را در رگرسیون وارد کنیم مشکل رگرسیون کاذب حل می‌شود. در این حالت تخمین‌های حداقل مربعات معمولی برای همه پارامتر‌ها سازگار می‌باشد.


شیوه‌ها [ویرایش]


شیوه‌های مهم تحلیل‌های رگرسیونی به شرج زیر هستند.


رگرسیون خطی ساده

رگرسیون خطی چندگانه

رگرسیون فازی

رگرسیون لجستیک

این تنوع باعث شده که بتوان به راحتی هر نوع داده‌ای (اغلب از نوع داده‌های پیوسته) را تحلیل کرد و به راحتی نتیجه گیری نمود.


محاسبه [ویرایش]


برای انجام یک تحلیل رگرسیونی ابتدا تحلیل‌گر حدس می‌زند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس می‌زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع‌آوری اطلاعات کمی از دو متغیر می‌پردازد و این داده‌ها را به صورت نقاطی در یک نمودار دو بعدی رسم می‌کند.


نرم افزارها [ویرایش]

نرم افزارهای بسیاری هستند که قابلیت محاسبه رگرسیون را دارند و مشهورترین آنها عبارتند از


نرم افزار اکسل (که ساده ترین نرم افزار است)

اس‌پی‌اس‌اس SPSS

اس‌پلاس +S یا Plus-S

ساس (نرم‌افزار) SAS

جستارهای وابسته [ویرایش]


رگرسیون

منابع [ویرایش]


رده‌ها: آمار ریاضیاقتصادسنجیتحلیل رگرسیونروش‌های آماری

تحلیل رگرسیون  از ویکی‌پدیا، دانشنامهٔ آزاد



در متن این مقاله از هیچ منبع و مأخذی نام برده نشده‌است.

شما می‌توانید با افزودن منابع برطبق اصول اثبات‌پذیری و شیوه‌نامهٔ ارجاع به منابع، به ویکی‌پدیا کمک کنید.

مطالب بی‌منبع احتمالاً در آینده حذف خواهند‌ شد.

تحلیل رگرسیونی یا تحلیل وایازش (به انگلیسی: Regression analysis) فن و تکنیکی آماری برای بررسی و مدل‌سازی ارتباط بین متغیرها است. رگرسیون تقریباً در هر زمینه‌ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیش بینی مورد نیاز است.


تحلیل رگرسیونی، یکی از پرکاربردترین روش در بین تکنیک‌های آماری است.


محتویات  [نهفتن] 

۱ تعریف لغوی

۲ تاریخچه

۳ رگرسیون کاذب

۴ شیوه‌ها

۵ محاسبه

۵.۱ نرم افزارها

۶ جستارهای وابسته

۷ منابع

تعریف لغوی [ویرایش]


واژه رگرسیون(Regression) را از لحاظ لغوی در فرهنگ لغت به معنی پسروی، برگشت و بازگشت است. اما از دید آمار و ریاضیات به مفهوم بازگشت به یک مقدار متوسط یا میانگین به کار می‌رود. بدین معنی که برخی پدیده‌ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می‌کنند.


تاریخچه [ویرایش]


در سال ۱۸۷۷ فرانسیس گالتون (به انگلیسی: Francis Galton) در مقاله‌ای که درباره بازگشت به میانگین منتشر کرده بود. اظهار داشت که متوسط قد پسران دارای پدران قد بلند، کمتر از قد پدرانشان می‌باشد. به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شده‌است. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده‌هایش مورد تأکید قرار داد. برای گالتون رگرسیون مفهومی زیست‌شناختی داشت اما کارهای او توسط کارل پیرسون (به انگلیسی: Karl Pearson) برای مفاهیم آماری توسعه داده شده. گرچه گالتون برای تأکید بر پدیده «بازگشت به سمت مقدار متوسط» از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده می‌شود.


رگرسیون کاذب [ویرایش]


رگرسیون کاذب (به انگلیسی: regression ) با فرض اینکه متغیرهای  و  مانا می‌باشد تخمین‌های ما از پارامترها و تستهای و درست می‌باشد. برای نشان دادن سازگاری تخمین‌های حداقل مربعات معمولی؛ ما از این نتایج زمانیکه اندازه نمونه افزایش می‌یابد و واریانس نمونه به واریانس جامعه همگرا می‌شود، استفاده می‌کنیم. متاسفانه وقتی سری نامانا باشد واریانس خوش تعریف نیست زیرا حول یک میانگین ثابت نوسان نمی‌کند. برای توضیح بیشتر دو متغیر  و  را در نظر بگیرید که بوسیله یک فرآیند گام تصادفی تعریف می‌شود.




که  و  دارای توزیع مستقل می‌باشد.هیچ دلیلی برای ارتباط بین  و  وجود ندارد یک محقق اگراثر  راروی  و یک جز ثابت رگرس کندو رگرسیون زیر را انجام دهد :


خط راست: 

نتایج این رگرسیون ممکن است بوسیله r^۲ بالاوخود همبستگی بالا بین باقیمانده هاو همجنین دارای ارزش معنی داری برای پارامتر  باشد. این پدیده به رگرسیون کاذب معروف است. در این گونه از موارد دو سری نامانا ارتباط کاذبی دارند به این علت که که هر دوی آنها در طول زمان تغییر می‌کنند و تابعی از زمانند. هماطور که گراجر و نی یو بلد بیان کردند در این حالت رگرسیون دارای r^۲ بالا؛ و آماره دوربین واتسون پایین خواهد بود و تستهای و  ممکن است خیلی گمراه کننده باشند. دلیل آن نیز این است که توزیع‌های آماره‌های تست‌های سنتی خیلی متفاوت از نتایجی که تحت فرض مانایی گرفته می‌شود، می‌باشد. بخصوص همانطور که فلیپس (۱۹۸۷)نشان داد؛ همانطور که اندازه نمونه افزایش می‌یابد نمی‌توان به معنی داری تخمین زن حداقل مربعات معمولی وآماره‌های تست‌های و  و آماره دوربین واتسون اعتماد کرد. دلیل آن این است که  و  متغیر‌های  می‌باشد و جر خطا نیزیک متغیرنامانامی‌باشد.


اگر ارزش‌های گذشته هر دو متغیر وابسته و مستقل را در رگرسیون وارد کنیم مشکل رگرسیون کاذب حل می‌شود. در این حالت تخمین‌های حداقل مربعات معمولی برای همه پارامتر‌ها سازگار می‌باشد.


شیوه‌ها [ویرایش]


شیوه‌های مهم تحلیل‌های رگرسیونی به شرج زیر هستند.


رگرسیون خطی ساده

رگرسیون خطی چندگانه

رگرسیون فازی

رگرسیون لجستیک

این تنوع باعث شده که بتوان به راحتی هر نوع داده‌ای (اغلب از نوع داده‌های پیوسته) را تحلیل کرد و به راحتی نتیجه گیری نمود.


محاسبه [ویرایش]


برای انجام یک تحلیل رگرسیونی ابتدا تحلیل‌گر حدس می‌زند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس می‌زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع‌آوری اطلاعات کمی از دو متغیر می‌پردازد و این داده‌ها را به صورت نقاطی در یک نمودار دو بعدی رسم می‌کند.


نرم افزارها [ویرایش]

نرم افزارهای بسیاری هستند که قابلیت محاسبه رگرسیون را دارند و مشهورترین آنها عبارتند از


نرم افزار اکسل (که ساده ترین نرم افزار است)

اس‌پی‌اس‌اس SPSS

اس‌پلاس +S یا Plus-S

ساس (نرم‌افزار) SAS

جستارهای وابسته [ویرایش]


رگرسیون

منابع [ویرایش]


رده‌ها: آمار ریاضیاقتصادسنجیتحلیل رگرسیونروش‌های آماری

فرآیند تحلیل سلسله مراتبی (AHP) چيست؟

فرآیند تحلیل سلسله مراتبی (AHP) در علم تصميم‌گيري كه در آن انتخاب يك راهكار از بين راهكارهاي موجود و يا اولويت‌بندي راهكارها مطرح است،‌ چند سالي است كه روشهاي تصميم گيري با شاخص‌هاي چند گانه «MADM» جاي خود را باز كرده‌اند. از اين ميان روش تحليل سلسله مراتبي (AHP) بيش از ساير روشها در علم مديريت مورد استفاده قرار گرفته است. فرايند تحليل سلسله مراتبي يكي از معروفترين فنون تصميم گيري چند منظوره است كه اولين بار توسط توماس ال. ساعتي عراقي الاصل در دهه 1970 ابداع گرديد. فرايند تحليل سلسله مراتبي منعكس كننده رفتار طبيعي و تفكر انساني است. اين تكنيك، مسائل پيچيده را بر اساس آثار متقابل آنها مورد بررسي قرار مي‌دهد و آنها را به شكلي ساده تبديل كرده به حل آن مي‌پردازد. فرايند تحليل سلسله مراتبي در هنگامي كه عمل تصميم گيري با چند گزينه رقيب و معيار تصميم گيري روبروست مي‌تواند استفاده گردد. معيارهاي مطرح شده مي‌تواند كمي و كيفي باشند. اساس اين روش تصميم گيري بر مقايسات زوجي نهفته است. تصميم گيرنده با فرآهم آوردن درخت سلسله مراتبي تصميم آغاز مي‌كند. درخت سلسله مراتب تصميم، عوامل مورد مقايسه و گزينه‌هاي رقيب مورد ارزيابي در تصميم را نشان مي‌دهد. سپس يك سري مقايسات زوجي انجام مي‌گيرد. اين مقايسات وزن هر يك از فاكتورها را در راستاي گزينه‌هاي رقيب مورد ارزيابي در تصميم را نشان مي‌دهد. در نهايت منطق فرآيند تحليل سلسله مراتبي به گونه‌اي ماتريسهاي حاصل از مقايسات زوجي را با يكديگر تلفيق مي‌سازد كه تصميم بهينه حاصل آيد. اصول فرآيند تحليل سلسله مراتبي توماس ساعتي (بنيان گزار اين روش) چهار اصل زير را به عنوان اصول فرآيند تحليل سلسله مراتبي بيان نموده و كليه محاسبات، قوانين و مقررات را بر اين اصول بنا نهاده است. اين اصول عبارتند از: شرط معكوسي: اگر ترجيح عنصر A بر عصر B برابر n باشد، ترجيح عنصر B بر عنصر A برابر خواهد بود. اصل همگني: عنصرA با عنصر B بايد همگن و قابل مقايسه باشند. به بيان ديگر برتري عنصر A بر عنصر B نمي‌تواند بي نهايت يا صفر باشد. وابستگي: هر عنصر سلسله مراتبي به عنصر سطح بالاتر خود مي‌تواند وابسته باشد و به صورت خطي اين وابستگي تا بالاترين سطح مي‌تواند ادامه داشته باشد. انتظارات : هرگاه تغييري در ساختمان سلسله مراتبي رخ دهد پروسة ارزيابي بايد مجدداً انجام گيرد. (قدسي پور،1381،ص6). مدل فرايند تحليل سلسله مراتبي بكارگيري اين روش مستلزم چهار قدم عمده زير مي‌باشد: الف) مدل سازي در اين قدم، مسأله و هدف تصميم گيري به صورت سلسله مراتبي از عناصر تصميم كه با هم در ارتباط مي‌باشند، در آورده مي‌شود. عناصر تصميم شامل «شاخصهاي تصميم گيري» و «گزينه‌هاي تصميم» مي‌باشد. فرايند تحليل سلسله مراتبي نيازمند شكستن يك مساله با چندين شاخص به سلسله مراتبي از سطوح است. سطح بالا بيانگر هدف اصلي فرايند تصميم گيري است. سطح دوم، نشان دهنده شاخص‌هاي عمده و اساسي "كه ممكن است به شاخص‌هاي فرعي و جزئي تر در سطح بعدي شكسته شود) مي‌باشد. سطح آخر گزينه‌هاي تصميم را ارائه مي‌كند. در شكل زیر سلسله مراتب يك مساله تصميم نشان داده شده است (مهرگان،1383،ص170). ب) قضاوت ترجيحي (مقايسات زوجي) انجام مقايساتي بين گزينه‌هاي مختلف تصميم،‌ بر اساس هر شاخص و قضاوت در مورد اهميت شاخص تصميم با انجام مقايسات زوجي، بعد از طراحي سلسله مراتب مساله تصميم، تصميم گيرنده مي‌بايست مجموعه ماتريسهايي كه به طور عددي اهميت يا ارجحيت نسبي شاخص‌ها را نسبت به يكديگر و هر گزينه تصميم را با توجه به شاخص‌ها نسبت به ساير گزينه‌ها اندازه‌گيري مي‌نمايد، ‌ايجاد كند. اين كار با انجام مقايسات دو به دو بين عناصر تصميم (مقايسه زوجي) و از طريق تخصيص امتيازات عددي كه نشان دهنده ارجحيت يا اهميت بين دو عنصر تصميم است، صورت مي‌گيرد. براي انجام اين كار معمولا از مقايسه گزينه‌ها با شاخص‌هايi ام نسبت به گزينه‌ها يا شاخص‌هاي j ام استفاده مي‌شود كه در جدول زیر نحوه ارزش گذاري شاخص‌ها نسبت به هم نشان داده شده است. ارزش گذاري شاخص‌ها نسبت به هم ارزش ترجيحي وضعيت مقايسهi نسبت به j توضيح 1 اهميت برابر گزينه يا شاخص i نسبت به j اهميت برابر دارند و يا ارجحيتي نسبت به هم ندارند. 3 نسبتاً مهمتر گزينه يا شاخص i نسبت به j كمي مهمتر است. 5 مهمتر گزينه يا شاخص i نسبت به j مهمتر است. 7 خيلي مهمتر گزينه يا شاخص i داراي ارجحيت خيلي بيشتري از j است. 9 كاملاً مهم گزينه يا شاخص مطلقاً i از j مهمتر و قابل مقايسه با j نيست. 2و4و6و8 ارزشهاي مياني بين ارزشهاي ترجيحي را نشان مي‌دهد مثلا 8، بيانگر اهميتي زيادتر از 7 و پايين‌تر از 9 براي I است. ج) محاسبات وزن‌هاي نسبي تعيين وزن «عناصر تصميم» نسبت به هم از طريق مجموعه‌اي از محاسبات عددي .قدم بعدي در فرايند تحليل سلسله مراتبي انجام محاسبات لازم براي تعيين اولويت هر يك از عناصر تصميم با استفاده از اطلاعات ماتريس‌هاي مقايسات زوجي است. خلاصه عمليات رياضي در اين مرحله به صورت زير است. مجموع اعداد هر ستون از ماتريس مقايسات زوجي را محاسبه كرده، سپس هر عنصر ستون را بر مجموع اعداد آن ستون تقسيم مي‌كنيم. ماتريس جديدي كه بدين صورت بدست مي‌آيد، «ماتريس مقايسات نرمال شده» ناميده مي‌شود. ميانگين اعداد هر سطر از ماتريس مقايسات نرمال شده را محاسبه مي‌كنيم. اين ميانگين وزن نسبي عناصر تصميم با سطرهاي ماتريس را ارائه مي‌كند. د) ادغام وزنهاي نسبي به منظور رتبه‌بندي گزينه‌هاي تصميم، در اين مرحله بايستي وزن نسبي هرعنصر را در وزن عناصر بالاتر ضرب كرد تا وزن نهايي آن بدست آيد. با انجام اين مرحله براي هر گزينه، مقدار وزن نهايي بدست مي‌آيد. سازگاري در قضاوت‌ها تقريباً تمامي محاسبات مربوط به فرايند تحليل سلسله مراتبي بر اساس قضاوت اوليه تصميم گيرنده كه در قالب ماتريس مقايسات زوجي ظاهر مي‌شود، صورت مي‌پذيرد و هر گونه خطا و ناسازگاري در مقايسه و تعيين اهميت بين گزينه‌ها و شاخص‌ها نتيجه نهايي به دست آمده از محاسبات را مخدوش مي‌سازد. نرخ ناسازگاري كه در ادامه با نحوه محاسبه آن آشنا خواهيم شد، وسيله‌اي است كه سازگاري را مشخص ساخته و نشان مي‌دهد كه تا چه حد مي‌توان به اولويتهاي حاصل از مقايسات اعتماد كرد. براي مثال اگر گزينه A نسبت به B مهمتر (ارزش ترجيحي 5) و B نسبتا مهمتر (ارزش ترجيحي 3) باشد، آنگاه بايد انتظار داشت A نسبت به C خيلي مهمتر (ارزش ترجيحي 7 يا بيشتر) ارزيابي گردد يا اگر ارزش ترجيحي A نسبت به B، 2 و B نسبت به C،‌ 3 باشد آنگاه ارزش A نسبت به C بايد ارزش ترجيحي 4 را ارائه كند. شايد مقايسه دو گزينه امري ساده باشد، اما وقتيكه تعداد مقايسات افزايش يابد اطمينان از سازگاري مقايسات به راحتي ميسر نبوده و بايد با به كارگيري نرخ سازگاري به اين اعتماد دست يافت. تجربه نشان داده است كه اگر نرخ ناسازگاري كمتر از 10/0 باشد سازگاري مقايسات قابل قبول بوده و در غير اينصورت مقايسه‌ها بايد تجديد نظر شود. قدم‌هاي زير براي محاسبه نرخ ناسازگاري به كار گرفته مي‌شود: گام 1. محاسبه بردار مجموع وزني: ماتريس مقايسات زوجي را در بردار ستوني «وزن نسبي» ضرب كنيد بردار جديدي را كه به اين طريق بدست مي‌آوريد، بردار مجموع وزني بناميد. گام 2. محاسبه بردار سازگاري: عناصر بردار مجموع وزني را بر بردار اولويت نسبي تقسيم كنيد. بردار حاصل بردار سازگاري ناميده مي‌شود. گام 3. بدست آوردن max، ميانگين عناصر برداري سازگاري max را به دست مي‌دهد. گام 4. محاسبه شاخص سازگاري: شاخص سازگاري بصورت زير تعريف مي‌شود: n عبارتست از تعداد گزينه‌هاي موجود در مساله گام 5. محاسبه نسبت سازگاري: نسبت سازگاري از تقسيم شاخص سازگاري برشاخص تصادفي بدست مي‌آيد. نسبت سازگاري 1/0 يا كمتر سازگاري در مقايسات را بيان مي‌كند(مهرگان،1383،ص173-170) شاخص تصادفي از جدول زیر استخراج مي‌شود. شاخص تصادفي (مهرگان،1383،ص173) 10 9 8 7 6 5 4 3 2 1 N 51/1 45/1 41/1 32/1 24/1 12/1 9/0 58/0 0 0 RI منابع: مهرگان، محمد رضا، " پژوهش عملیاتی پیشرفته "، انتشارات کتاب دانشگاهی، چاپ اول، 1383. قدسی پور، سید حسن، " مباحثی در تصمیم گیری چند معیاره "، انتشارات دانشگاه امیر کبیر، چاپ سوم، 1381.

منبع اصلي:www.shariati.ir/other/mahmoud/IT/AHP.pd

آلفاي كرونباخ چيست؟

ﺭﻭﺵ ﺁﻟﻔﺎﻱ ﻛﺮﻭﻧﺒﺎﺥ ﺑﺮﺍﻱ ﺗﻌﻴﻴﻦ ﭘﺎﻳﺎﻳﻲ ﭘﺮﺳﺸﻨﺎﻣﻪ

ﺩﺭ ﻋﻠﻭﻡ ﺍﻧﺳﺎﻧﯽ ﻭ ﺭﻓﺗﺎﺭی ﺑﻳﺷﺗﺭ ﺗﺣﻘﻳﻘﺎﺕ ﺑﺭ ﺍﺳﺎﺱ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺻﻭﺭﺕ ﻣﯽ ﮔﻳﺭﺩ. ﻣﻭﺿﻭﻉ ﮐﻧﺗﺭﻝ ﮐﻳﻔﻳﺕ ﻧﺗﺎﻳﺞ ﻳﮏ ﭘﺭﺳﺷﻧﺎﻣﻪ 

ﺩﺍﻣﻧﻪ ﻭﺳﻳﻌﯽ ﺍﺯ ﻣﻭﺿﻭﻋﺎﺕ ﻣﺧﺗﻠﻑ ﺭﺍ ﺩﺭ ﺑﺭ ﻣﯽ ﮔﻳﺭﺩ. ﺍﮔﺭ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺭﺍ ﻣﺎﻧﻧﺩ ﻳﮏ ﺁﺯﻣﻭﻥ ﻓﺭﺽ ﮐﻧﻳﻡ، ﺑﻪ ﻁﻭﺭ ﮐﻠﯽ ﻣﯽ ﺗﻭﺍﻥ 

ﮔﻔﺕ ﻳﮏ ﺁﺯﻣﻭﻥ ﺧﻭﺏ ﺑﺎﻳﺩ ﺍﺯ ﻭﻳژﮔﯽ ﻫﺎی ﻣﻁﻠﻭﺑﯽ ﻣﺎﻧﻧﺩ ﻋﻳﻧﻳﺕ، ﺳﻬﻭﻟﺕ ﺍﺟﺭﺍ، ﻋﻣﻠﯽ ﺑﻭﺩﻥ، ﺳﻬﻭﻟﺕ ﺗﻌﺑﻳﺭ ﻭ ﺗﻔﺳﻳﺭ، ﺭﻭﺍﻳﯽ ﻭ 

ﭘﺎﻳﺎﻳﯽ ﺑﺭﺧﻭﺭﺩﺍﺭ ﺑﺎﺷﺩ ﺗﺎ ﺑﻪ ﻧﺗﺎﻳﺞ ﺩﺭﺳﺗﯽ ﻣﻧﺟﺭ ﺷﻭﺩ. ﺩﺭ ﺑﻳﻥ ﺍﻳﻥ ﻭﻳژﮔﯽ ﻫﺎ ﺭﻭﺍﺋﯽ ﻭ ﭘﺎﻳﺎﺋﯽ ﺍﺯ ﺍﻫﻣﻳﺕ ﺑﻳﺷﺗﺭی ﺑﺭﺧﻭﺭﺩﺍﺭﻧﺩ. ﺩﺭ 

ﺯﻳﺭ ﺭﻭﺵ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺭﺍ ﮐﻪ ﺷﺎﻳﻊ ﺗﺭ ﺍﺯ ﺭﻭﺷﻬﺎی ﺩﻳﮕﺭ ﺍﺳﺕ، ﻣﻭﺭﺩ ﺑﺭﺭﺳﯽ ﻗﺭﺍﺭ ﺩﺍﺩﻩ ﺍﻳﻡ. 

ﺭﻭﺵ ﺍﺳﺗﻔﺎﺩﻩ ﺍﺯ ﺿﺭﻳﺏ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺭﺍ ﺑﺭﺍی ﺗﻌﻳﻳﻥ ﭘﺎﻳﺎﻳﯽ ﻳﮏ ﭘﺭﺳﺷﻧﺎﻣﻪ ﻳﺎ ﺁﺯﻣﻭﻥ ﺑﺎ ﺗﺎﮐﻳﺩ ﺑﺭ ﻫﻣﺑﺳﺗﮕﯽ ﺩﺭﻭﻧﯽ ﻣﯽ ﺗﻭﺍﻥ 

ﺍﺳﺗﻔﺎﺩﻩ ﮐﺭﺩ. ﺩﺭ ﺍﻳﻥ ﺭﻭﺵ ﺍﺟﺯﺍ ﻳﺎ ﻗﺳﻣﺕ ﻫﺎی ﭘﺭﺳﺷﻧﺎﻣﻪ ﺑﺭﺍی ﺳﻧﺟﺵ ﺿﺭﻳﺏ ﭘﺎﻳﺎﻳﯽ ﺁﺯﻣﻭﻥ ﺑﻪ ﮐﺎﺭ ﻣﯽ ﺭﻭﻧﺩ. ﺍﮔﺭ ﺳﻭﺍﻻﺕ ﺑﻪ 

ﺻﻭﺭﺕ ﺩﻭ ﺣﺎﻟﺗﯽ (ﺩﺭﺳﺕ =1 ﻭ ﻏﻠﻁ = ﺻﻔﺭ) ﺩﺭ ﻧﻅﺭ ﮔﺭﻓﺗﻪ ﺷﻭﻧﺩ، ﺿﺭﻳﺏ ﺁﻟﻔﺎ ﺍﺯ ﺭﺍﺑﻁﻪ ﺯﻳﺭ ﻗﺎﺑﻝ ﻣﺣﺎﺳﺑﻪ ﺧﻭﺍﻫﺩ ﺑﻭﺩ. 

α =

𝑘𝑘

𝑘𝑘−1

(1 −

∑ 𝑝𝑝𝑝𝑝

𝑠𝑠

2

)

 ﮐﻪ ﺩﺭ ﺁﻥ k ﺗﻌﺩﺍﺩ ﺳﻭﺍﻻﺕ ، p ﺗﻌﺩﺍﺩ ﭘﺎﺳﺦ ﻫﺎی ﺩﺭﺳﺕ، q ﺗﻌﺩﺍﺩ ﭘﺎﺳﺦ ﻫﺎی ﻏﻠﻁ ﻭ �𝑠�

2

 ﻭﺍﺭﻳﺎﻧﺱ ﮐﻝ ﺳﻭﺍﻻﺕ ﺍﺳﺕ ﻭ ﺍﮔﺭ ﺳﻭﺍﻻﺕ 

ﺑﻪ ﺻﻭﺭﺕ ﺍﺭﺯﺷﯽ ﺑﺎﺷﻧﺩ (ﻫﺭ ﺳﻭﺍﻝ ﺍﺭﺯﺵ ﻣﺭﺑﻭﻁ ﺧﻭﺩ ﺭﺍ ﺩﺍﺷﺗﻪ ﺑﺎﺷﺩ) ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺍﺯ ﺭﺍﺑﻁﻪ ﺯﻳﺭ ﻣﻳﺯﺍﻥ ﭘﺎﻳﺎﻳﯽ ﺁﺯﻣﻭﻥ ﺭﺍ 

ﻣﺣﺎﺳﺑﻪ ﻣﯽ ﮐﻧﺩ.

α =

𝑘𝑘

𝑘𝑘−1

�1 −

∑ 𝑠𝑠

𝑖𝑖

𝑘𝑘 2

𝑖𝑖=1

𝑠𝑠

2

� (1)

ﮐﻪ ﺩﺭ ﺁﻥ k ﺗﻌﺩﺍﺩ ﺳﻭﺍﻻﺕ، �𝑠�

𝑖𝑖

2

 ﻭﺍﺭﻳﺎﻧﺱ ﻫﺭ ﺳﻭﺍﻝ ﻭ �𝑠�

2

  ﻭﺍﺭﻳﺎﻧﺱ ﮐﻝ ﺳﻭﺍﻻﺕ ﺍﺳﺕ.

ﭘﺎﻳﺎﻳﯽ ﭘﺭﺳﺷﻧﺎﻣﻪ: ﺍﺯ ﺁﻧﺟﺎ ﮐﻪ ﻳﮏ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺑﺎ ﺗﻌﺩﺍﺩی ﺳﻭﺍﻝ (ﻣﺎﻧﻧﺩ ﻁﻳﻑ 5 ﮔﺯﻳﻧﻪ ﺍی ﻟﻳﮑﺭﺕ) ﻣﺎﻧﻧﺩ ﻳﮏ ﺁﺯﻣﻭﻥ ﺍﺳﺕ، ﻣﯽ ﺗﻭﺍﻥ ﺍﺯ 

ﺭﺍﺑﻁﻪ (1) ﻣﻘﺩﺍﺭ ﭘﺎﻳﺎﻳﯽ ﺭﺍ ﺑﻪ ﮐﻣﮏ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺑﻪ ﺩﺳﺕ ﺁﻭﺭﺩ. 

ﺍﻣﺎ ﺍﮔﺭ ﺑﻪ ﺟﺎی ﺳﻭﺍﻻﺕ ﻳﺎ ﻣﺎﺩﻩ ﻫﺎ، ﺁﺯﻣﻭﻥ ﺍﺯ ﺑﺧﺵ ﻫﺎ ﻳﺎ ﻗﺳﻣﺕ ﻫﺎﻳﯽﺗﺷﮑﻳﻝ ﺷﺩﻩ ﺑﺎﺷﺩ ﻣﺛﻝ ﺯﻣﺎﻧﯽ ﮐﻪ ﻳﮏ ﺁﺯﻣﻭﻥ ﺍﺯ ﺗﻌﺩﺍﺩی ﺧﺭﺩﻩ 

ﺁﺯﻣﻭﻥ ﺗﺷﮑﻳﻝ ﺷﺩﻩ ﺍﺳﺕ ﻭ ﺑﺧﻭﺍﻫﻳﻡ ﺍﺯ ﺁﻥ ﻫﺎ ﺩﺭ ﻣﺣﺎﺳﺑﻪ ﺿﺭﻳﺏ ﭘﺎﻳﺎﻳﯽ ﮐﻝ ﺁﺯﻣﻭﻥ ﺍﺳﺗﻔﺎﺩﻩ ﮐﻧﻳﻡ، ﺑﺎﺯ ﻫﻡ ﻣﯽ ﺗﻭﺍﻥ ﺍﺯ ﺭﻭﺵ ﺁﻟﻔﺎی 

ﮐﺭﻭﻧﺑﺎﺥ ﻣﻁﺎﺑﻕ ﺑﺎ ﺭﺍﺑﻁﻪ (1) ﺍﺳﺗﻔﺎﺩﻩ ﮐﺭﺩ.

 ﺭﻭﺵ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﻧﻪ ﺗﻧﻬﺎ ﺑﺭﺍی ﮔﺯﻳﻧﻪ ﻫﺎی ﺩﻭ ﺍﺭﺯﺷﯽ ﺻﻔﺭ ﻭ ﻳﮏ، ﺑﻠﮑﻪ ﺑﺭﺍی ﮔﺯﻳﻧﻪ ﻫﺎی ﭼﻧﺩ ﺍﺭﺯﺷﯽ (ﻣﺎﻧﻧﺩ ﻣﺎﻧﻧﺩ ﻁﻳﻑ 5

ﮔﺯﻳﻧﻪ ﺍی ﻟﻳﮑﺭﺕ) ﻧﻳﺯ ﻗﺎﺑﻝ ﺍﺳﺗﻔﺎﺩﻩ ﺍﺳﺕ. ﺍﮔﺭ ﺑﺧﺵ ﻫﺎی ﺁﺯﻣﻭﻥ ﻳﺎ ﺧﺭﺩﻩ ﺁﺯﻣﻭﻥ ﻫﺎﻳﯽ ﮐﻪ ﺍﺯ ﻣﺟﻣﻭﻉ ﺁﻧﻬﺎ ﺁﺯﻣﻭﻥ ﮐﻠﯽ ﺗﺷﮑﻳﻝ ﺷﺩﻩ  

ﺍﺳﺕ ﺑﻪ ﻁﻭﺭ ﺟﺩﺍﮔﺎﻧﻪ ﻧﻣﺭﻩ ﮔﺫﺍﺭی ﺷﻭﻧﺩ، ﺩﺭ ﺁﻥ ﺻﻭﺭﺕ ﺿﺭﻳﺏ ﺁﻟﻔﺎ ﻣﺳﺗﻠﺯﻡ ﺍﻳﻥ ﻧﻳﺳﺕ ﮐﻪ ﺗﮏ ﺗﮏ ﺳﻭﺍﻻﺕ ﺑﻪ ﺻﻭﺭﺕ ﺻﺣﻳﺢ ﻭ 

ﻏﻠﻁ ﺑﺎﺷﻧﺩ.

ﺑﺭﺍی ﺗﻭﺿﻳﺢ ﺑﻳﺷﺗﺭ ﺩﺭ ﻣﻭﺭﺩ ﭼﮕﻭﻧﮕﯽ ﺍﺳﺗﻔﺎﺩﻩ ﺍﺯ ﺿﺭﻳﺏ ﺁﻟﻔﺎ، ﻓﺭﺽ ﮐﻧﻳﺩ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺍی ﺟﻬﺕ ﺁﺯﻣﻭﻥ ﺳﻪ ﻓﺭﺿﻳﻪ ﻁﺭﺍﺣﯽ ﺷﺩﻩ 

ﺍﺳﺕ ﮐﻪ ﺳﻭﺍﻻﺕ ﻣﺭﺑﻭﻁ ﺑﻪ ﻫﺭ ﻓﺭﺿﻳﻪ ﻳﮏ ﺧﺭﺩﻩ ﺁﺯﻣﻭﻥ ﻣﺣﺳﻭﺏ ﻣﯽ ﺷﻭﺩ. 

ﻓﺭﺽ ﮐﻧﻳﺩ ﻭﺍﺭﻳﺎﻧﺱ 3 ﺧﺭﺩﻩ ﺁﺯﻣﻭﻥ ﺑﺭﺍﺑﺭ ﺑﺎ:

    ﻭ ﻭﺍﺭﻳﺎﻧﺱ ﮐﻝ ﺁﺯﻣﻭﻥ ﺑﺭﺍﺑﺭ ﺍﺳﺕ ﺑﺎ �𝑠�

2

ﺑﺎﺷﺩ

ﺑﺎ ﺗﻭﺟﻪ ﺑﻪ ﺍﻳﻥ ﮐﻪ k=3 ﺍﺳﺕ، ﺿﺭﻳﺏ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺑﻪ ﺻﻭﺭﺕ ﺯﻳﺭ ﻣﺣﺎﺳﺑﻪ ﻣﯽ ﺷﻭﺩ:

ﮔﻔﺗﻪ ﻣﯽ ﺷﻭﺩ ﺍﮔﺭ ﺿﺭﻳﺏ ﺁﻟﻔﺎ ﺑﻳﺷﺗﺭ ﺍﺯ 0.7 ﺑﺎﺷﺩ، ﺁﺯﻣﻭﻥ ﺍﺯ ﭘﺎﻳﺎﻳﯽ ﻗﺎﺑﻝ ﻗﺑﻭﻟﯽ ﺑﺭﺧﻭﺭﺩﺍﺭ ﺍﺳﺕ. ﻣﺛﻼ ﺁﺯﻣﻭﻥ ﻓﻭﻕ ﭘﺎﻳﺎﻳﯽ ﻗﺎﺑﻝ 

ﻗﺑﻭﻟﯽ ﺩﺍﺭﺩ. 

ﺗﻣﺭﻳﻥ ﺯﻳﺭ ﻳﮏ ﺗﻣﺭﻳﻥ ﻋﻣﻠﯽ ﺍﺯ ﻧﺣﻭﻩ ﺑﻪ ﺩﺳﺕ ﺁﻭﺭﺩﻥ ﻣﻳﺯﺍﻥ ﭘﺎﻳﺎﻳﯽ ﻳﮏ ﭘﺭﺳﺷﻧﺎﻣﻪ (ﺑﺎ 10 ﺳﻭﺍﻝ 5 ﮔﺯﻳﻧﻪ ﺍی ﻟﻳﮑﺭﺕ) ﺑﺭ ﺍﺳﺎﺱ 

ﺷﺎﺧﺹ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺩﺭ spss ﺍﺳﺕ. 

ﺗﻣﺭﻳﻥ ﻋﻣﻠﯽ ﺍﺯ ﺗﺣﻠﻳﻝ ﭘﺎﻳﺎﻳﯽ ﻭ ﺗﺷﺧﻳﺹ ﺳﻭﺍﻻﺕ ﺯﺍﺋﺩ ﭘﺭﺳﺷﻧﺎﻣﻪ

ﺍﮔﺭ ﺳﻭﺍﻻﺕ ﻳﮏ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺭﺍ ﺩﺭ ﺍﺧﺗﻳﺎﺭ ﺩﺍﺭﻳﺩ، ﺩﺭ ﻧﺭﻡ ﺍﻓﺯﺍﺭ spss ﺑﻪ ﭘﻧﺟﺭﻩ  Data Editor ﺑﺭﻭﻳﺩ. ﻫﺭ ﺳﻭﺍﻝ ﺭﺍ ﺑﻪ ﻋﻧﻭﺍﻥ 

ﻳﮏ ﻣﺗﻐﻳﺭ ﺗﻌﺭﻳﻑ ﮐﻧﻳﺩ ﻭ ﻣﻘﺎﺩﻳﺭ ﺁﻥ ﺭﺍ ﺩﺭ ﺍﻳﻥ ﭘﻧﺟﺭﻩ ﻭﺍﺭﺩ ﻧﻣﺎﻳﻳﺩ. (ﺑﻪ ﺷﮑﻝ ﺯﻳﺭ ﺗﻭﺟﻪ ﮐﻧﻳﺩ) ﺳﭘﺱ ﻣﺭﺍﺣﻝ ﺯﻳﺭ ﺭﺍ ﺩﻧﺑﺎﻝ ﮐﻧﻳﺩ:  

• ﺍﺯ ﻣﻧﻭی ﺁﻧﺎﻟﻳﺯ (Analyze) ﺑﻪ ﻣﻧﻭی Scale ﺑﺭﻭﻳﺩ . ﺳﭘﺱ ﺯﻳﺭ ﻣﻧﻭی Reliability Analysis ﺭﺍ ﺍﻧﺗﺧﺎﺏ ﮐﻧﻳﺩ ﺗﺎ 

ﮐﺎﺩﺭ ﻣﺣﺎﻭﺭﻩ ﺗﺣﻠﻳﻝ ﭘﺎﻳﺎﻳﯽ ﺑﺎﺯ ﺷﻭﺩ.2 ﻣﻳﺭﺯﺍﺩﻩ ﻣﺣﻣﺩﺭﺿﺎ ﺗﻭﺳﻁ ﺷﺩﻩ ﺗﻬﻳﻪ  | www.M-Mirzadeh.Blogfa.com

ﮐﺎﺩﺭ ﻣﺣﺎﻭﺭﻩ ﺗﺣﻠﻳﻝ ﭘﺎﻳﺎﻳﯽ ﻣﺎﻧﻧﺩ ﺷﮑﻝ ﺯﻳﺭ ﺍﺳﺕ

• ﻫﺭ ﻳﮏ ﺍﺯ ﻣﺗﻐﻳﺭﻫﺎی ﻣﻁﺎﻟﻌﻪ  ﺭﺍ ﺑﻪ ﭼﻬﺎﺭﮔﻭﺵ :Items ﻣﻧﺗﻘﻝ ﮐﻧﻳﺩ. (ﭼﻭﻥ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺍی ﮐﻪ ﻣﻥ ﺑﺭﺍی ﺍﻳﻥ ﺗﻣﺭﻳﻥ ﺩﺭ 

ﺍﺧﺗﻳﺎﺭ ﺩﺍﺭﻡ  ﺷﺎﻣﻝ ﺩﻩ ﺳﻭﺍﻝ ﺍﺳﺕ، ﻣﻥ ﺑﺎﻳﺩ 10 ﻣﺗﻐﻳﺭ ﺩﺍﺷﺗﻪ ﺑﺎﺵﻡ ﻭ ﺁﻧﻬﺎ ﺭﺍ ﺑﻪ ﺳﻣﺕ ﺭﺍﺳﺕ ﻣﻧﺗﻘﻝ ﮐﻧﻡ.)

• ﺑﺭﺭﺳﯽ ﮐﻧﻳﺩ ﺩﺭ ﺑﺧﺵ :model (ﭘﺎﻳﻳﻥ ﮐﺎﺩﺭ ﻣﺣﺎﻭﺭﻩ) ﮔﺯﻳﻧﻪ Alpha ﺍﻧﺗﺧﺎﺏ ﺷﺩﻩ ﺑﺎﺷﺩ.

• OK ﺭﺍ ﮐﻠﻳﮏ ﮐﻧﻳﺩ ﻭ ﺩﺭ ﺧﺭﻭﺟﯽ ﻧﺗﺎﻳﺞ ﺭﺍ ﻣﺷﺎﻫﺩﻩ ﮐﻧﻳﺩ. 

ﺍﮔﺭ ﺿﺭﻳﺏ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ 0/7 ﻳﺎ ﺑﻳﺷﺗﺭ ﺍﺳﺕ، ﭘﺭﺳﺷﻧﺎﻣﻪ ﺍﺯ ﭘﺎﻳﺎﻳﯽ ﻣﻁﻠﻭﺑﯽ ﺑﺭﺧﻭﺭﺩﺍﺭ ﺍﺳﺕ ﻭ ﻣﯽ ﺗﻭﺍﻧﻳﺩ ﺍﺯ ﺑﺎﺑﺕ ﻫﻣﺑﺳﺗﮕﯽ 

ﺩﺭﻭﻧﯽ ﺳﻭﺍﻻﺕ ﻣﻁﻣﺋﻥ ﺑﺎﺷﻳﺩ. ﻭﻟﯽ ﺍﮔﺭ ﻣﻘﺩﺍﺭ ﺁﻟﻔﺎ ﮐﻣﺗﺭ ﺍﺯ 0/7 ﺍﺳﺕ (ﻣﺎﻧﻧﺩ ﻧﺗﺎﻳﺟﯽ ﮐﻪ ﻣﻥ ﺍﺯ ﻧﻣﻭﻧﻪ 10 ﺳﻭﺍﻟﯽ ﮔﺭﻓﺗﻡ) ﺑﻬﺗﺭ 

ﺍﺳﺕ ﺳﻭﺍﻻﺗﯽ ﺭﺍ ﮐﻪ ﺑﺎ ﺳﺎﻳﺭ ﺳﻭﺍﻻﺕ ﻫﻣﺑﺳﺗﮕﯽ ﮐﻣﺗﺭی ﺩﺍﺭﻧﺩ ﺷﻧﺎﺳﺎﻳﯽ ﻭ ﺍﺯ ﻣﺟﻣﻭﻋﻪ ﺳﻭﺍﻻﺕ ﺣﺫﻑ ﮐﻧﻳﺩ ﺗﺎ ﻣﻘﺩﺍﺭ ﺁﻟﻔﺎ ﺍﻓﺯﺍﻳﺵ 

ﭘﻳﺩﺍ ﮐﻧﺩ. ﻫﺭﭼﻧﺩ ﺍﮔﺭ ﺿﺭﻳﺏ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺑﻳﻥ (0/5 ﺗﺎ 0/7) ﺑﺎﺷﺩ ﺍﻋﺗﺑﺎﺭ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺩﺭ ﺣﺩ ﻣﺗﻭﺳﻁ ﺍﺭﺯﻳﺎﺑﯽ ﻣﯽ ﺷﻭﺩ. ﺑﺭﺍی 

ﺷﻧﺎﺳﺎﻳﯽ ﻭ ﺣﺫﻑ ﺳﻭﺍﻻﺕ ﻧﺎﻫﻣﺑﺳﺗﻪ، ﻣﺭﺍﺣﻝ ﺯﻳﺭ ﺭﺍ ﺩﻧﺑﺎﻝ ﮐﻧﻳﺩ:

• ﻣﺟﺩﺩﺍ ﺑﻪ ﮐﺎﺩﺭ ﻣﺣﺎﻭﺭﻩ ﭘﺎﻳﺎﻳﯽ ﺑﺭﻭﻳﺩ ﻭ ﺍﺯ ﮔﺯﻳﻧﻪ Statistics ﺑﻪ ﮐﺎﺩﺭ ﻣﺣﺎﻭﺭﻩ ﺷﮑﻝ ﺯﻳﺭ ﻣﻧﺗﻘﻝ ﺷﻭﻳﺩ.

  3 ﻣﻳﺭﺯﺍﺩﻩ ﻣﺣﻣﺩﺭﺿﺎ ﺗﻭﺳﻁ ﺷﺩﻩ ﺗﻬﻳﻪ  | www.M-Mirzadeh.Blogfa.com

ﺍﮔﺭ ﭘﺎﻳﺎﻳﯽ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺩﺭ ﺣﺩ ﻣﻁﻠﻭﺏ ﻧﺑﺎﺷﺩ ﺑﺎ ﺗﺷﺧﻳﺹ ﺳﻭﺍﻻﺕ ﺯﺍﺋﺩ، ﺑﺎﻳﺩ ﻣﻘﺩﺍﺭ ﭘﺎﻳﺎﻳﯽ ﺭﺍ ﺑﻪ ﺣﺩ ﻣﻁﻠﻭﺏ ﺑﺭﺳﺎﻧﯽ ﺩ . ﺍﻳﻥ ﺍﻣﮑﺎﻥ ﺩﺭ 

ﻧﺭﻡ ﺍﻓﺯﺍﺭ spss ﻭﺟﻭﺩ ﺩﺍﺭﺩ ﮐﻪ ﺑﺗﻭﺍﻥ ﻭﺿﻌﻳﺕ ﻫﺭ ﺳﻭﺍﻝ ﺭﺍ ﺍﺯ ﻧﻅﺭ ﭘﺎﻳﺎﻳﯽ ﺩﺭ ﻣﺟﻣﻭﻋﻪ ﺳﻭﺍﻻﺕ ﺑﺭﺭﺳﯽ ﮐﺭﺩ. 

• ﺑﺭﺍی ﺍﻳﻥ ﮐﻪ ﺑﺧﻭﺍﻫﻳﺩ ﺍﺛﺭ ﺣﺫﻑ ﻫﺭ ﺳﻭﺍﻝ ﺭﺍ ﺑﺭ ﺿﺭﻳﺏ ﺁﻟﻔﺎ ﻣﻌﻳﻥ ﮐﻧﻳﺩ ﻭ ﺩﺭ ﻣﻭﺭﺩ ﺣﺫﻑ ﺳﻭﺍﻻﺕ ﺍﺿﺎﻓﻪ ﺗﺻﻣﻳﻡ ﺑﮕﻳﺭﻳﺩ، 

ﺩﺭ ﮐﺎﺩﺭ ﻣﺣﺎﻭﺭﻩ Reliability Analysis: statistics ﮔﺯﻳﻧﻪ Scale if item delete ﺭﺍ ﺍﻧﺗﺧﺎﺏ ﻧﻣﺎﻳﻳﺩ.

• ﮐﻠﻳﺩ ﻫﺎی Continue ﻭ Ok ﺭﺍ ﺑﻪ ﺗﺭﺗﻳﺏ ﮐﻠﻳﮏ ﮐﻧﻳﺩ ﻭ ﻧﺗﺎﻳﺞ ﺭﺍ ﺩﺭﺧﺭﻭﺟﯽ ﻣﺷﺎﻫﺩﻩ ﻧﻣﺎﻳﻳﺩ.

ﺩﺭ ﺧﺭﻭﺟﯽ spss ﺳﻪ ﺟﺩﻭﻝ ﮐﻪ ﻣﻬﻣﺗﺭ ﺍﺯ ﺑﻘﻳﻪ ﻫﺳﺗﻧﺩ، ﺑﻪ ﺻﻭﺭﺕ ﺯﻳﺭ ﻣﺷﺎﻫﺩﻩ ﺧﻭﺍﻫﻳﺩ ﮐﺭﺩ: 

ﺟﺩﻭﻝ ﺍﺻﻠﯽ ﺟﺩﻭﻝ Reliability Statistics ﺍﺳﺕ ﮐﻪ ﺩﺭ ﺁﻥ ﻣﻘﺩﺍﺭ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺭﺍ ﺑﺭﺍی ﺳﻭﺍﻻﺗﯽ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺍی ﮐﻪ ﻣﻥ ﺩﺍﺭﻡ 

ﺑﺭﺍﺑﺭ 660. ﻣﺷﺎﻫﺩﻩ ﻣﯽ ﮐﻧﻳﺩ. 

ﺩﺭ ﺟﺩﻭﻝ Item Statistics ﺷﻣﺎ ﻣﺗﻐﻳﺭﻫﺎ، ﻣﻳﺎﻧﮕﻳﻥ ﻭ ﺍﻧﺣﺭﺍﻑ ﻣﻌﻳﺎﺭ ﻫﺭ ﻳﮏ ﺍﺯ ﺳﻭﺍﻻﺕ ﻭ ﺗﻌﺩﺍﺩ ﻧﻣﻭﻧﻪ ﻫﺎ ﺭﺍ ﻣﺷﺎﻫﺩﻩ ﻣﯽ ﮐﻧﻳﺩ. 

ﻫﺭ ﭼﻪ ﻣﻘﺩﺍﺭ ﺁﻟﻔﺎ ﺑﻪ ﻳﮏ ﻧﺯﺩﻳﮑﺗﺭ ﺑﺎﺷﺩ ﻧﺷﺎﻥ ﺍﺯ ﭘﺎﻳﺎﻳﯽ ﺑﻳﺷﺗﺭ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺩﺍﺭﺩ . ﺍﮔﺭ ﻣﻘﺩﺍﺭﺁﻟﻔﺎ ﺑﻳﺷﺗﺭ ﺍﺯ  0.7 ﺑﺎﺷﺩ ﭘﺎﻳﺎﻳﯽ ﺧﻭﺏ ﻭ 

ﺍﮔﺭ ﺑﻳﻥ 0.5 ﺗﺎ 0.7 ﺑﺎﺷﺩ ﭘﺎﻳﺎﻳﯽ ﻣﺗﻭﺳﻁ ﻭ ﺍﮔﺭ ﮐﻣﺗﺭ ﺍﺯ 0.5 ﺑﺎﺷﺩ ﭘﺭﺳﺷﻧﺎﻣﻪ ﻓﺎﻗﺩ ﭘﺎﻳﺎﻳﯽ ﻻﺯﻡ ﺍﺳﺕ. 

ﺩﺭ ﺍﻳﻥ ﻣﺛﺎﻝ ﻣﻘﺩﺍﺭ ﺁﻟﻔﺎ ﻧﺷﺎﻥ ﻣﯽ ﺩﻫﺩ ﮐﻪ ﻣﻳﺯﺍﻥ ﭘﺎﻳﺎﻳﯽ ﭘﺭﺳﺷﻧﺎﻣﻪ ﺩﺭ ﺣﺩ ﻣﺗﻭﺳﻁ ﺍﺳﺕ. 

Reliability Statistics

Cronbach's Alpha

Cronbach's Alpha 

Based on 

Standardized Items

N of Items

.660 .673 10

Item Statistics

Mean Std. Deviation N

x1 3.67 1.209 48

x2 2.85 1.148 48

x3 4.35 .911 48

x4 1.98 .978 48

x5 3.02 1.158 48

x6 4.33 .724 48

x7 2.81 1.045 48

x8 2.79 1.304 48

x9 2.73 .917 48

x10 3.00 1.149 484 ﻣﻳﺭﺯﺍﺩﻩ ﻣﺣﻣﺩﺭﺿﺎ ﺗﻭﺳﻁ ﺷﺩﻩ ﺗﻬﻳﻪ  | www.M-Mirzadeh.Blogfa.com

Item-Total Statistics

Scale Mean if 

Item Deleted

Scale Variance if 

Item Deleted

Corrected ItemTotal 

Correlation

Cronbach's Alpha if Item Deleted

ﻣﻘﺪﺍﺭ ﺁﻟﻔﺎی ﮐﺮﻭﻧﺒﺎﺥ، ﭘﺲ ﺍﺯ ﺣﺬﻑ ﺳﻮﺍﻝ

x1 27.88 27.346 -.061 .717

x2 28.69 25.326 .121 .678

x3 27.19 24.709 .276 .645

x4 29.56 24.719 .243 .651

x5 28.52 22.297 .403 .618

x6 27.21 25.105 .332 .638

x7 28.73 21.606 .550 .589

x8 28.75 21.128 .435 .609

x9 28.81 22.751 .509 .604

x10 28.54 20.722 .574 .579

ﺩﺭ ﺟﺩﻭﻝ Item-Total Statistics ﺩﺭ ﺳﺗﻭﻥ ﺍﻭﻝ ﻧﺎﻡ ﻣﺗﻐﻳﺭﻫﺎ (ﺳﻭﺍﻻﺕ) ﻭ ﺷﺎﺧﺹ ﻫﺎی ﺳﺗﻭﻥ ﻫﺎی ﺑﻌﺩی ﺩﺭ ﺻﻭﺭﺕ ﺣﺫﻑ ﺍﻳﻥ 

ﻣﺗﻐﻳﺭ ﺁﻣﺩﻩ ﺍﺳﺕ. ﺩﺭ ﺳﺗﻭﻥ ﺩﻭﻡ ﻣﻳﺎﻧﮕﻳﻥ ﺍﻣﺗﻳﺎﺯﺍﺕ ﻫﺭ ﺳﻭﺍﻝ ﭘﺱ ﺍﺯ ﺣﺫﻑ ﺳﻭﺍﻝ ﻣﻭﺭﺩ ﻧﻅﺭ، ﺩﺭ ﺳﺗﻭﻥ ﺳﻭﻡ ﻭﺍﺭﻳﺎﻧﺱ ﺍﻣﺗﻳﺎﺯﺍﺕ، ﺩﺭ 

ﺳﺗﻭﻥ ﭼﻬﺎﺭﻡ ﻫﻣﺑﺳﺗﮕﯽ ﺑﻳﻥ ﻣﺗﻐﻳﺭﻫﺎ ﻭ ﺩﺭ ﺳﺗﻭﻥ ﭘﻧﺟﻡ ﻣﻘﺩﺍﺭ ﺁﻟﻔﺎی ﮐﺭﻭﻧﺑﺎﺥ ﺭﺍ ﺑﺎ ﺗﻭﺟﻪ ﺑﻪ ﺣﺫﻑ ﻣﺗﻐﻳﺭ ﻣﻭﺭﺩ ﻧﻅﺭ ﺭﺍ ﺷﺎﻫﺩ ﻫﺳﺗﻳﺩ. 

ﺑﺎ ﺗﻭﺟﻪ ﺑﻪ ﺍﻳﻥ ﮐﻪ ﺑﺎ ﺣﺫﻑ ﺳﻭﺍﻝ ﻳﮏ، ﺿﺭﻳﺏ ﺁﻟﻔﺎ ﺑﻪ ﻣﻘﺩﺍﺭ 0.717 ﺍﻓﺯﺍﻳﺵ ﭘﻳﺩﺍ ﻣﯽ ﮐﻧﺩ، ﻣﯽ ﺗﻭﺍﻥ ﺳﻭﺍﻝ ﻳﮏ ﺭﺍ ﺍﺯ ﻣﺟﻣﻭﻋﻪ 

ﺳﻭﺍﻻﺕ ﺣﺫﻑ ﮐﺭﺩ. 

ﺍﻳﻥ ﺭﻭﻧﺩ ﺭﺍ ﺑﻪ ﻫﻣﻳﻥ ﺗﺭﺗﻳﺏ ﻭ ﺗﺎ ﻭﻗﺗﯽ ﮐﻪ ﺣﺫﻑ ﺳﻭﺍﻻﺕ ﻧﺎﻫﻣﺑﺳﺗﻪ ﻣﻧﺟﺭ ﺑﻪ ﻣﻘﺩﺍﺭ ﻣﻁﻠﻭﺏ ﺁﻟﻔﺎ ﻣﯽﺷﻭﺩ، ﺍﺩﺍﻣﻪ ﺩﻫﻳﺩ.

ضريب آلفاي کرونباخ؛ مفاهيم، کارکرد و شيوه هاي نوين آن  

دکترامير تيمور پاينده1، دکتر مريم اميدي نجف آبادی2، فهيمه مسعودي فر3

1و 3: دانشگاه شهيد بهشتي، دانشکده علوم رياضي، گروه آمار

2: دانشگاه آزاد اسلامي واحد علوم وتحقيقات، گروه ترويج و آموزش کشاوزي

amirtpayandeh@sbu.ac.ir 

چکيده :

بي شک همه ي ما درطول دوران زندگي خود حداقل يکبار پرسشنامه پرکرده ايم. تا بحال ازخود پرسيده ايد که اين پرسشنامه ها چگونه تهيه مي شوند و نيز معياري براي بررسي ميزان قابليت اطمينان آنها وجود دارد يا خير؟ بديهي است که چنين مقياسي وجود دارد، چرا که بسياري از بررسي ها ي آماري درسطوح وسيع ابتدا درقالب پرسش نامه پايه گذاري مي شوند، پس مي بايست ملاکي براي نظارت  بر قابليت  اعتماد  آنها  وجود داشته باشد.

در اين مقاله، ابتدا به مفهوم ضريب آلفاي کرونباخ و کارکرد آن، شيوه محاسبه آن با استفاده از نرم افزارهاي آماري مي پردازد. نهايتا به معرفي تتاي ترتيبي  و ارائه برنامه ای جهت محاسبه آن (با استفاده از نرم افزار R)خواهيم پرداخت.

مفهوم ضريب آلفاي کرونباخ:

ضريب آلفاي کرونباخ توسط کرونباخ ابداع شده و يکي ازمتداولترين روشهاي اندازه گيري اعتماد پذيري و يا پايائي پرسش نامه هاست. منظور از اعتبار يا پايايي پرسش نامه اين است که اگر صفت هاي مورد سنجش با همان وسيله و تحت شرايط مشابه و در زمانهاي مختلف مجددا اندازه گيري شوند، نتايج تقريبا يکسان حاصله شود.

 ضريب آلفاي کرونباخ، براي سنجش ميزان تک بعدي بودن نگرشها، عقايد و ... بکار مي رود. در واقع مي خواهيم ببينيم تا چه حد برداشت پاسخگويان از سوالات يکسان بوده است. اساس اين ضريب بر پايه مقياسهاست. مقياس عبارتند از دسته اي از اعداد که بر روي يک پيوستار به افراد، اشيا يا رفتارها در جهت به کميت کشاندن کيفيت ها اختصاص داده مي شود. رايج ترين مقياس که در تحقيقات اجتماعي بکار مي رود مقياس ليکرت است. در مقياس ليکرت اساس کار بر فرض هم وزن بودن گويه ها استوار است. بدين ترتيب به هر گويه نمراتي (مثلا از1 تا 5 براي مقياس ليکرت 5 گويه اي) داده مي شود که مجموع نمراتي که هر فرد از گويه ها مي گيرد نمايانگر گرايش او خواهد بود. 

آلفاي کرونباخ بطورکلي با استفاده از يکي روابط  زيرمحاسبه مي شود.

  يا   

که دراين روابط  k تعداد سوالات،   واريانس سوال i ام،   واريانس مجموع کلي سوالات،  ميانگين کواريانس بين سوالات، و   واريانس ميانگين سوالات مي باشند (برگرفته شده از آلن و ين، 2002). 

با استفاده از تعريف آلفاي کرونباخ مي توان نتيجه گرفت: (1) هرقدرهمبستگي مثبت بين سوالات بيشتر شود، ميزان آلفاي کرونباخ بيشتر خواهد شدو بالعکس، (2) هر قدر واريانس ميانگين سوالات بيشتر شود آلفاي کرونباخ کاهش پيدا خواهد کرد، (3) افزايش تعداد سوالات تاثيرمثبت و يا منفي (بسته به نوع همبستگي بين سوالات) بر ميزان آلفاي کرونباخ خواهد گذاشت، (4) افزايش حجم نمونه باعث کاهش واريانس ميانگين سوالات در نتيجه باعث افزايش آلفاي کرونباخ خواهد شد. 

بديهي است هرقدر شاخص آلفاي کرونباخ به 1نزديکترباشد، همبستگي دروني بين سوالات بيشتر و در نتيجه پرسشها همگن ترخواهند بود. کرونباخ ضريب پايايي %45 را کم، %75 را متوسطو قابل قبول، و ضريب %95 را زياد پيشنهاد کرده (کرونباخ، 1951). بديهي است درصورت پايين بودن مقدارآلفا، بايستي بررسي شود که با حذف کدام پرسشها مقدارآن را مي توان افزايش داد. 

تتاي ترتيبي:

در سال 1974 آمارداني به نام آمور در مورد استفاده از آلفاي کرونباخ آماردانان ديگر را به چالش کشيد. استدلال او اين بود که آلفاي کرونباخ بر علاوه بر نارايب بوده (نارايبي مثبت)، بر اساس شاخص هاي تعريف و محاسبه مي گردنند که مربوط به داده هاي با مقياس فاصله اي و يا نسبتي هستند، بنابراين استفاده از آلفاي کرونباخ براي محاسبه اي ميزان پايائي پرسش نامه هاي که حاوي سوالات ترتيبي هستند دقيق به نظر نمي رسد. او براي رفع اين مشکل شاخص جديدي تحت عنوان تتاي ترتيبي به صورت زير ارائه داد.

 

که   بيشترين مقدار ويژه در تحليل مولفه اي اصلي مي باشد. اخيرا زامبو، گادرومن، و زيسر (2007) به مطالعه اين شاخص پرداخته و با چندين مثال شبيه سازي شده نشان دادند که ضريب آلفاي کرونباخ هميشه مقدار پاياي را کم برآورد مي کند. بنابراين توصيه مي شود که در هنگامي که داده ها ترتيبي هستنند به جاي آلفاي کرونباخ از تتاي ترتيبي استفاده شود.

چگونگي محاسبه به همراه مثال عملي:

بسياري از نرم افزارهاي آماري قادر به محاسبه آلفاي کرونباخ هستند. در اين قسمت از مقاله چگونگي محاسبه ي آلفاي کرونباخ را توسط دو نرم افزار SPSS و SAS شرح داده، سپس با ارائه يک برنامه به زبان R  چگونگي محاسبه ي آلفاي کرونباخ و تتاي ترتيبي را توسط نرم افزار R نشان مي دهيم. در ادامه با استفاده از سوالات نمونه گيري مقدماتي اميدي (1387) چگونگي سنجش آلفاي کرونباخ و تتاي ترتيبي را نشان مي دهيم.

براي محاسبه آلفاي کرونباخ  به کمک نرم افزار SPSS مسير زيررا دنبال مي کنيم :

Analyze> Scale> Reliability Analysis…

چنانچه مايل باشيم بررسي کنيم که حذف هرسوال چه ميزان روي ضريب آلفاي کرونباخ تاثير مي گذارد، بعد از باز شدن پنجره “Reliability Analysis Reliability Analysis” روي گزينه Statistics کليک کرده و در قسمت “Descriptive for” گزينه “Scale if item deleted”  را انتخاب کنيم.

خروجي نرم افزارSPSS براي داده هاي اميدي (1387) به صورت زيرخواهد بود:

جدول1) خروجی نرم افزار شامل ضريب آلفا و تعداد سوالات

Reliability Statistics

Cronbach's Alpha N of Items

.855 13





جدول2) خروجی نرم افزار

Item-Total Statistics

Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item-Total Correlation Cronbach's Alpha if Item Deleted

V1 48.159 45.067 .470 .848

V2 48.500 44.488 .517 .845

V3 47.977 46.162 .484 .847

V4 48.318 43.989 .660 .838

V5 48.045 44.230 .495 .846

V6 49.227 45.808 .147 .890

V7 47.864 44.074 .690 .837

V8 48.136 43.283 .653 .837

V9 48.000 45.442 .515 .846

V10 48.068 43.646 .616 .839

V11 47.841 43.532 .680 .836

V12 48.318 43.106 .597 .840

V13 48.545 41.323 .671 .834


همانطوريکه ملاحظه مي شود مقدارآلفاي محاسبه شده برابر85 درصد است، که مقدار قابل قبولي است. همانطور که جدول شماره 2 نشان مي دهد حذف سوال ششم (v6) باعث افزايش آلفاي کرونباخ به 89 درصد خواهد شد.   

آلفاي کرونباخ در نرم افزار SAS با استفاده از دستور 

proc corr alpha nocorr nomiss; Variables; run;

محاسبه مي گردد. که به دلايل مشابه بودن خروجي با نرم افزار SPSS از ذکر جزئيات آن خوداري مي کنيم. 

دو نرم افزار SPSS  و SAS قادر به محاسبه ي تتاي ترتيبي نمي باشند و نرم افزار S-plus و R توانائي محاسبه آلفاي کرونباخ را ندارند.

در ادامه با ارائه تابعي (پيوست الف) چگونگي محاسبه آلفاي کرونباخ و تتاي ترتتيبي را توسط R  نشان مي دهيم. 

خروجي برنامه بالا تحت نرم افزار R  براي داده هاي اميدي (1387) در جدول 3 خلاصه شده است.

جدول 3) خروجی برنامه پيوست الف

New_Theta $` Ordinal Theta if a Question Deleted` New_Alpha $`Alpha if a Question Deleted`

0.8849911 Without Question 1 0.8476305 Without Question 1

0.8840719 Without Question 2 0.8448156 Without Question 2

0.8867511 Without Question 3 0.8474065 Without Question 3

0.8765560 Without Question 4 0.8377251 Without Question 4

0.8854676 Without Question 5 0.8461963 Without Question 5

0.8949432 Without Question 6 0.8899667 Without Question 6

0.8737700 Without Question 7 0.8368503 Without Question 7

0.8754874 Without Question 8 0.8368983 Without Question 8

0.8834650 Without Question 9 0.8455129 Without Question 9

0.8782972 Without Question 10 0.8390775 Without Question 10

0.8741109 Without Question 11 0.8361389 Without Question 11

0.8814010 Without Question 12 0.8395971 Without Question 12

0.8775920 Without Question 13 0.8338930 Without Question 13

$`Ordinal Theta for all Question=`  0.8895967 $`Cronbach's Alpha for all Question=` 0.8551825


نتيجه آلفاي کرونباخ جدول بالا مشابه با نرم افزار SPSS مي باشد. همچنين تتاي ترتيبي نيز نتيجه مشابه با آلفاي کرونباخ ارائه مي دهد با اين تفاوت که تتاي ترتيبي برآوردگر دقيق تر نسبت به آلفاي کرونباخ براي پايائي سوالات ارائه مي کند.

نتيجه گيري:

با توجه به کم برآورد پايائي توسط آلفاي کرونباخ توصيه مي شود پايائي سوالات ترتيبي با استفاده از تتاي ترتيبي سنجيده شود.


منابع :

1- Armor, D. J. (1974). Theta reliability and factor scaling. Sociological methodology, 17-50.

2- Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika. 16, 297-334.

3- Diener, E , Emmons, R. A., Larsen, R. J., & Griffin, S. (1985). The satisfaction with life scale. Journal of Personality Assessment, 49, 71-75 .

4- Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading MA: Addison-Wesley Publishing Company.

5- Zumbo, D. B., Gadermann, A. M., and Zeisser, C. (2007). Ordinal versions of coefficient alpha and theta for Likert rating scales. Journal of modern applied statistical methods, 6, 21-29.

6- اميدي، م. (1387). طراحی نظام فناوری اطلاعات و ارتباطات به منظور آموزش کارگزاران خصوصی بيمه کشاورزی ايران. رساله دکتری واحد علوم و تحقيقات دانشگاه آزاد اسلامی. 

  

پيوست الف  (برنامه محاسباتي آلفاي کرونباخ و تتاي ترتيبي توسط نرم افزار R)

Alpha<-function(all_data){

N<-ncol(all_data)

  D<-c()  

Q<-c()

# Cronbach’s alpha calculation

Alpha_Cronbach<-function(data){

k<-ncol(data)  

s<-cov(data)  

A<-c()

sumcov<-sum(s) 

for(i in 1:k){

A<-c(A,s[i,i]) }

sumcov<-sumcov-sum(A)

alpha<-1/((k-1)*mean(A)/sumcov+(1-1/k))

return(alpha) }

 # Ordinal’s theta calculation

theta_ordinal<-function(data){

p<-ncol(data)

p/(p-1)*(1-1/max(eigen(cor(data))$value)) }

for (j in 1: N){

D<-c(D,Alpha_Cronbach(all_data[-j]))

Q<-c(Q,theta_ordinal(all_data[-j])) }

D<-c(D)

list("Alpha if a Question Deleted" = data.frame("New "=""," Alpha"=D, row.names=paste("Without Question.",1:N))

,"Cronbach's Alpha for all Question="=Alpha_Cronbach(all_data),

"Ordinal Theta if a Question Deleted"=data.frame("New "="","Theta"=Q, row.names=paste("Without Question.",1:N))

,"Ordinal Theta for all Question="=theta_ordinal(all_data)) }


رگرسیون چیست؟

رگرسیون چیست؟

تاریخچه : 

واژه رگرسیون در فرهنگ لغت به معنی بازگشت است و اغلب جهت رساندن مفهوم "بازگشت به یک مقدار متوسط یا میانگین” به کار می رود. بدین معنی که برخی پدیده ها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل می کنند .

 بیش از 100 سال پیش در سال 1877 فرانسیس گالتون (Francis Galton) در مقاله ای که در همین زمینه منتشر کرد اظهار داشت که متوسط قد پسران دارای پدران قد بلند ، کمتر از قد پدرانشان می باشد . به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شده است. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در داده هایش مورد تأکید قرار داد . برای گالتون رگرسیون مفهومی زیست شناختی داشت اما کارهای او توسط کارل پیرسون (Karl Pearson) برای مفاهیم آماری توسعه داده شده . گرچه گالتون برای تأکید بر پدیده "بازگشت به سمت مقدار متوسط" از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده می شود .  

نمودار پراکندگی :

در حقیقت تحلیل رگرسیونی فن و تکنیکی آماری برای بررسی و مدل سازی ارتباط بین متغیرها است. رگرسیون تقریباً در هر زمینه ای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیشبینی مورد نیاز است . می توان گفت تحلیل رگرسیونی، پرکاربردترین روش در بین تکنیک های آماری است. شمایی کلی و خلاصه شده از یک تحلیل رگرسیونی ساده به صورت زیر می باشد: 

در ابتدا تحلیل گر حدس می زند که بین دو متغیر نوعی ارتباط وجود دارد ، در حقیقت حدس می زند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمع آوری اطلاعات کمی از دو متغیر می پردازد و این داده ها را به صورت نقاطی در یک نمودار دو بعدی رسم می کند.

 این نمودار که به آن نمودار پراکندگی [scatter plot] گفته می شود نقش بسیار مهمی را در تحلیل های رگرسیونی و نمایش ارتباط بین متغیرها ایفا می کند.

 در صورتی که نمودار نشان دهنده این باشد که داده ها تقریباً (نه لزوماً دقیق) در امتداد یک خط مستقیم پراکنده شده اند، حدس تحلیل گر تأیید شده و این ارتباط خطی به صورت زیر نمایش داده می شود:                          

y = a x + b

 که در آن  a عرض از مبدأ و b شیب این خط است.

متغیر ها و خطا : 

بین برخی از نقاط و تصویر آنها بر روی خط رگرسیونی (خط y) کمی تفاوت به چشم می­خورد که از آن به عنوان خطای برآورد یاد می کنیم. 

 این خطا ممکن است از خطا در اندازه گیری ، شرایط محیط ، تفاوت های طبیعی و... ناشی شده باشد. بنابراین معادله اولیه را به صورت زیر اصلاح می کنیم :

y = ax + b + ?

معادله بالا یک مدل رگرسیون خطی نامیده می شود . معمولاً به x متغیر مستقل (رگرسیونی) و به y متغیر وابسته (پاسخ) گفته می­شود . که ? خطای تصادفی است که برای کامل شدن مدل و نشان دادن این که خطا نیز تا حدی وجود دارد در نظر گرفته می شود.

فرضیات : 

معمولا فرض میشود که خطاها یکدیگر را خنثی میکنند ، به عبارت دیگر مجموع خطا ها برابر صفر است . همچنین فرض میشود خطای موجود در یک مشاهده رابطه ای با خطاهای دیگر ندارد و در نهایت تغییرات بین خطاها ثابت در نظر گرفته میشود . این سه فرض برای ساختن یک مدل ضروری است و روشهای بسیاری برای پی بردن به وجود (یا عدم برقراری ) این فرض ها وجود دارد . یکی از دلایل استفاده های نادرست از رگرسیون معمولا نادیده گرفتن این فرض ها است که موجب استدلال های غلط خواهد شد .

در صورتی که در مدل رگرسیونی فقط یک متغیر مستقل وجود داشته باشد، مدل را مدل رگرسیونی خطی ساده می نامند.

روش های رگرسیونی : 

ا این مرحله مدل رگرسیونی معرفی شده و کافی است پارامترهای مجهول مدل (در اینجا a و b) برآورد شوند. برآورد پارامترها در مدل سازی با استفاده از روش های مختلف انجام میشود از جمله روش کمترین مربع خطا .


 

روش کمترین مربع خطا که یکی از روش های مورد استفاده در تحلیل رگرسیونی است اولین بار توسط لژندر (Legendre) ریاضیدان فرانسوی در سال 1805 و گوس (Gauss) ریاضیدان مشهور آلمانی در سال 1809 معرفی و در مطالعات نجومی به کار برده شد . 

پس تا این قسمت تحلیل گر مدلی مشخص را به عنوان الگویی برای داده ها معرفی کرده است. مرحله بعدی "کنترل مناسب بودن مدل" می باشد که مدل از نظر قابل استفاده بودن و این که تا چه حد می تواند خوب داده ها را بیان کند بررسی می شود و در مورد بکارگیری مدل تصمیم گرفته می شود. در نتیجه مدل یا قابل استفاده تشخیص داده می شود و یا اینکه باید اصلاح شود . بنابراین تحلیل رگرسیونی فرآیندی همراه با تکرار و بازنگری است، یعنی در ابتدا مدلی معرفی می شود، کیفیت مدل مورد بررسی قرار میگیرد ، مدل قبول و یا اینکه مجدداً اصلاح می شود.

رابطه قد و وزن، رابطه عرضه و تقاضا در علم اقتصاد، تعیین رابطه بین سن افراد و فشارخون آنها، رابطه بین میزان مطالعه دانش آموزان و سطح نمرات آنها، رابطه بین نمرات و میزان قبولی در کنکور سراسری مثال هایی ساده در کاربرد رگرسیون  هستند .

¤ نویسنده: سیامک داداشی

تحليل رگرسيوني  

 تحليل رگرسيوني

براي تحليل رگرسيوني و تعيين ميزان همبستگي بين متغيرها و به خصوص هر يك از متغيرها با متغير ملاك مي توانستيم از ضريب همبستگي پيرسون يا اسپيرمن استفاده كنيم. ( همانطور كه در آزمون فرضيات استفاده شد ) ولي بهترين روش ، استفاده از رگرسيون چند متغيره بود. زيرا رگرسيون چند متغيره ، گسترش ضريب همبستگي بين دو  متغير مي باشد كه يك متغير و تغييرات آن را بر اساس چندين متغير ديگر ( متعغير پيش بين يا مستقل ) پيش بيني مي كنيم. در اين تحقيق ، براي تعيين سهم نسبي هريك از متغيرهاي پيش بين از دو روش استفاده كرديم. در روش اول ، به نام روش « هم زمان Simultaneous » كه در نرم افزار SPSS روش Enter خوانده مي شود ، متغيرهاي مورد نظر را به عنوان متغيرهاي پيش بين وارد كرده و با مشخص كردن متغير ملاك ( وابسته ) كه در اين پژوهش ميزان رضايت بازنشستگان از وضعيت بازنشستگي خود مي باشد ، ميزان تأثير گذاري متغيرها و نتيجه آزمون را مشخص كرديم.

در روش دوم كه روش « قدم به قدم Stepwise » ناميده مي شود استفاده كرديم. بدين صورت كه بعد از وارد كردن همه متغيرهاي پيش بين ، متغيرهايي كه بيشترين تأثير را داشتند ، مشخص  گرديد. كه در زير در سه بخش كل نمونه آماري ، در بين بازنشستگان آموزش و پرورش و در بين بازنشستگان ساير ادارات توضيح داده مي شوند.

الف) در كل نمونه آماري : ضريب همبستگي چند متغيره بين متغيرها به استناد جداول استخراجي ( 777/0 R= ) مي باشد و 604/0  R2 = است كه تقريباً رقم بالايي را نشان مي دهد و به دليل اين كه همبستگي به دست آمده داراي سطح معناداري 000/0 است ، مشخص مي كند كه با اطمينان 99 درصد 604/0 از عوامل مؤثر بر ميزان رضايت بازنشستگان ، شناسايي و حدود 396/0 ناشناخته مانده اند. بعد از استفاده از روش دوم نيز مشخص شد كه از بين عوامل مؤثر ، متغيرهاي ارزش و اعتبار افراد در نزد جامعه ، رضايت از دوران خدمت در اداره متبوع ، برخورد اطرافيان 



مسئوليت رسكي قبل از بازنشستگي ، ميزان تحصيلات و نوع وسيله نقليه اي كه استفاده مي كنند به نسبت ساير عوامل تأثيرات بيشتري داشته اند.

ب) در بين بازنشستگان آموزش و پرورش : ضريب همبستگي چند متغيره بين متغيرها به استناد جداول استخراجي 746/0 R =  و 583/0 R2 = است و همچنين به دليل اين كه F‌ به دست آمده داراي سطح معناداري 000/0 است ، مي توان ادعا كرد كه با اطمينان 99 درصد حدود 583/0 درصد از عوامل مؤثر بر ميزان رضايت بازنشستگان شناسايي شده اند. و حدود 417/0 ناشناخته مانده اند. با استفاده از روش دوم نيز مشخص گرديد كه از بين عوامل وارد شده ، متغيرهاي ارزش و اعتبار افراد در جامعه ، ارزش افراد در خانواده ، رضايت از دوران خدمت در اداره متبوع ، داشتن شغل دوم ، وضعيت سلامت جسماني ، ميزان رضايت از شغل دوم و ميزان تحصيلات ، بيشتر از ساير عوامل تأثير گذار بوده اند.

ج) در بين بازنشستگان ساير ادارات : ضريب همبستگي چند متغيره بين متغيرها به استناد جداول استخراجي در بين بازنشستگان ساير ادارات 836/0  R= مي باشد و 699/0 R2= است كه به نسبت بازنشستگان فرهنگي در سطح بالاتري قرار دارد. و نشان مي دهد كه با اطمينان 99 درصد مي توان ادعا نمود كه حدود 699/0 از عوامل مؤثر بر ميزان رضايت بازنشستگان در اين گروه شناسايي شده و حدود 301/0 ناشناخته مانده اند.

بعد از استفاده از روش دوم مشخص گرديد كه از بين عوامل و متغيرهاي تأثير گذار و وارد شده در رگرسيون ، متغيرهاي ارزش و اعتبار فرد در جامعه ، ميزان رضايت از دوران خدمت در اداره متبوع، ميزان رضايت از شغل دوم ، تأمين هزينه هاي زندگي ، برخورد اطرافيان با آن ها و ميزان تحصيلات بازنشستگان بيشتر از ساير عوامل تأثير داشته اند.


تحليل رگرسيون لجستيك چند سطحي يا MULTINOMIAL LOGIT از طريق نرم افزار R

تحليل رگرسيون لجستيك چند سطحي يا MULTINOMIAL LOGIT از طريق نرم افزار R:

http://www.amaracademy.com/essays.php?id=12&title=%D9%86%D8%AD%D9%88%D9%87_%D9%85%D8%AD%D8%A7%D8%B3%D8%A8%D9%87_Multinomial_Logistic_Regression_%D8%AF%D8%B1_%D9%86%D8%B1%D9%85_%D8%A7%D9%81%D8%B2%D8%A7%D8%B1_R

ﻣﻘﺎﻳﺴﻪ  ﻱ ﻣﺪﻝ ﺭﮔﺮﺳﻴﻮﻥ ﻟﹸ ﺠﺴﺘﻴﻚ ﭼﻨﺪﺳﻄﺤﻲ  ﺑﺎ ﺭﮔﺮﺳﻴﻮﻥ  ﻟﹸﺠﺴﺘﻴﻚ ﻣﻌﻤﻮﻟﻲ  ﺩﺭ ﺗﻌﻴﻴﻦ ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ ﻛ

  

ﻣﺠﻠﻪﻱ ﻏﺪﺩ ﺩﺭﻭﻥﺭﻳﺰ ﻭ ﻣﺘﺎﺑﻮﻟﻴﺴﻢ ﺍﻳﺮﺍﻥ  

ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﻜﻲ ﻭ ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ ـ ﺩﺭﻣﺎﻧﻲ ﺷﻬﻴﺪ ﺑﻬﺸﺘﻲ  

ﺩﻭﺭﻩﻱ ﺩﻭﺍﺯﺩﻫﻢ، ﺷﻤﺎﺭﻩ ۴ﻱ ، ﺻﻔﺤﻪ  ﻫﺎﻱ۳۶۴ ـ ۳۵۹ (ﺁﺑﺎﻥ ۱۳۸۹   )

  

  

ﻣﻘﺎﻳﺴﻪ  ﻱ ﻣﺪﻝ ﺭﮔﺮﺳﻴﻮﻥ ﻟﹸ ﺠﺴﺘﻴﻚ ﭼﻨﺪﺳﻄﺤﻲ  ﺑﺎ ﺭﮔﺮﺳﻴﻮﻥ

ﻟﹸﺠﺴﺘﻴﻚ ﻣﻌﻤﻮﻟﻲ  ﺩﺭ ﺗﻌﻴﻴﻦ ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ ﻛﻮﺩﻛﺎﻥ  

  

ﺭﺿﻮﺍﻧﻪ ﭼﺮﺍﻏﻲ

۱

 ، ﺩﻛﺘﺮ ﻳﺪﺍﻟﻪ ﻣﺤﺮﺍﺑﻲ

۲

 ، ﺩﻛﺘﺮ ﻣﺤﻤﺪ ﺭﺿﺎ ﺍﺷﺮﺍﻗﻴﺎﻥ

۳

 ، ﺩﻛﺘﺮ ﺣﺴﻴﻦ ﺩﻟﺸﺎﺩ

۴

، ﺩﻛﺘﺮ  ﺪﻴﺣﻤ ﻋﻠﻮ  ﻱ ﻣﺠﺪ

۵

  

) ۱ ﺷﻌﺒﻪ  ﻦﻴﺑ ﻱ ﺍﻟﻤﻠﻞ ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﻜﻲ ﻭ ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ -ﺩﺭﻣﺎﻧﻲ ﺷﻬﻴﺪﺑﻬﺸﺘﻲ ) ۲، ﺩﺍﻧﺸﻜﺪﻩ  ﻱ ﺑﻬﺪﺍﺷﺖ  ،

ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﻜﻲ ﻭ ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ-ﺩﺭﻣﺎﻧﻲ ﺷﻬﻴﺪ ﺑﻬﺸﺘﻲ، ﺩ) ۳ ﺍﻧﺸﻜﺪﻩ  ﻱ ﺑﻬﺪﺍﺷﺖ  ، ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﻜﻲ

ﺗﻬﺮﺍﻥ  )۴، ﻣﺮﻛﺰ ﺗﺤﻘﻴﻘﺎﺕ ﻏﺪﺩ ﺩﺭﻭﻥﺭﻳﺰ، ﭘﮋﻭﻫﺸﻜﺪﻩ ﻋﻠﻮﻡ ﻏﺪﺩ ﺩﺭﻭﻥ  ﻭ ﺭﻳﺰ ﻣﺘﺎﺑﻮﻟﻴﺴﻢ ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﻜﻲ ﻭ 

ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ ﺩﺭﻣﺎﻧﻲ ﺷﻬﻴﺪﺑﻬﺸﺘﻲ ) ۵، ﺩﺍﻧﺸﮑﺪﻩ ﻴﭘ ﻱ ﺮﺍﭘﺰﺷﮑ  ﻲ، ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﮑﻲ ﻭ ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ  -

ﺩﺭﻣﺎﻧﻲ  ﺪﻴﺷﻬ ﺑﻬﺸﺘ  ﻲ؛ ﻧﺸﺎﻧﻲ ﻣﮑﺎﺗﺒﻪﻱ  ﻧﻮﻳﺴﻨﺪﻩﻱ  ﻣﺴﺌﻮﻝ  : ﺗﻬﺮﺍﻥ، ﻳﺍﻭ  ﻦ، ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﻜﻲ ﻭ ﺧﺪﻣﺎﺕ 

ﺑﻬﺪﺍﺷﺘﻲ -ﺩﺭﻣﺎﻧﻲ ﺷﻬﻴﺪ ﺑﻬﺸﺘﻲ، ﺩﺍﻧﺸﻜﺪﻩ  ﻱ ﺑﻬﺪﺍﺷﺖ، ﮔﺮﻭﻩ ﻴﺍﭘ ﻴﺪﻣ ﻮﻟﻮﮊﻱ، ﺩﻛﺘﺮ ﻳﺪﺍﻟﻪ ﻣﺤﺮﺍﺑﻲ؛                               

  e-mail:ymehrabi@gmail.com 

ﭼﻜﻴﺪﻩ  

ﻣﻘﺪﻣﻪ: ﻫﺪﻑ ﺍﻳ  ﻦ ﻣﻄﺎﻟﻌﻪ ﻣﻘﺎﻳﺴﻪ ﻋﻤﻠﮑﺮﺩ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ ﭼﻨﺪ ﺳﻄﺤﻲ ﻭ ﻣﻌﻤﻮﻟﻲ ﺩﺭ ﺗﻌﻴﻴﻦ ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ  ﺩﺭ

ﻛﻮﺩﻛﺎﻥ  ﺑﺎ ﺗﻮﺟﻪ  ﺑﻪ ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪ  ﻣﺮﺍﺗﺒ  ﻲ  ﻫﺎ ﺩﺍﺩﻩ  ﻣﻲﺑﺎﺷﺪ  . ﻣﻮﺍﺩ  ﻭ ﺭﻭﺵﻫﺎ : ﺁﺯﻣﻮﺩﻧﻲﻫﺎﻱ ﻣﻄﺎﻟﻌﻪ ﺷﺎﻣﻞ ۳۵۷۴۷ ﺩﺍﻧﺶﺁﻣﻮﺯ

 ۱۰-۸ ﺳﺎﻟﻪ ﺳﺎﮐﻦ  ۳۰ ﺍﺳﺘﺎﻥ ﮐﺸﻮﺭ ﺑﻮﺩﻧﺪ ﻭ ﺩﺍﺩﻩ  ﻫﺎ ﺗﻮﺳﻂ ﭘﮋﻭﻫﺸﻜﺪﻩﻱ ﻋﻠﻮﻡ ﻏﺪﺩ ﺩﺭﻭﻥﺭﻳﺰ  ﻭ ﻣﺘﺎﺑﻮﻟﻴ  ﺴﻢ ﺩﺍﻧﺸﮕﺎ  ﻩ ﻋﻠﻮﻡ

ﭘﺰﺷﮑ  ﻲ  ﺪﻴﺷﻬ ﺑﻬﺸﺘ  ﺑﻪ ﻲ ﺭﻭﺵ ﻧﻤﻮﻧﻪﮔﻴﺮﻱ ﺗﺼﺎﺩﻓﻲ  ﻃﺒﻘﻪﺍﻱ  ﻭ ﺧﻮﺷﻪﺍﻱ  ﺟﻤﻊﺁﻭﺭﻱ ﺷﺪﻧﺪ  . ﻭﺿﻌﻴﺖ ﮔﻮﺍﺗﺮ، ﺟﻨﺲ، ﻣﺤﻞ

ﺳﮑﻮﻧﺖ، ﺍﺭﺗﻔﺎﻉ  ﺍﺯ ﺳﻄﺢ  ﻭ ﺎﻳﺩﺭ ﻱ ﺷﻴﻮﻩ ﻧﮕﻬﺪﺍﺭﻱ ﻧﻤﻚ ﻳ ﺪﺩﺍﺭ  ﺩﺭ ﺧﺎﻧﻮﺍﺩﻩ  ﻫﺎ ﺛﺒﺖ ﺷﺪ. ﻣﺪﻝ ﭼﻨﺪ ﺳﻄﺤﻲ ﺑﺮﺍﻱ ﺗﺤﻠ  ﻞﻴ

 ﻫﺎ ﺩﺍﺩﻩ ﺍﺳﺘﻔﺎﺩﻩ  ﺑﺎ  ﻭ ﻳﺎﻓﺘﻪﻫﺎﻱ ﺣﺎﺻﻞ  ﺍﺯ ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ ﻣﻌﻤﻮﻟﻲ ﻳﻣﻘﺎ  ﺴﻪ  .ﺷﺪ ﻳﺎﻓﺘﻪﻫﺎ : ﻣﻄﺎﻟﻌﻪ ﻧﺸﺎﻥ  ﺩﺍﺩ  ﻛﻪ ۷۴/۵  % 

ﺩﺍﻧﺶﺁﻣﻮﺯ  ﺍﻥ ﺩﺍﺭﺍﻱ ﮔﻮﺍﺗﺮ ﺑﻮﺩﻩﺍﻧﺪ ﺩﺭ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ ﺩﻭﺳﻄﺤﻲ، ﻭﺍﺭﻳﺎﻧﺲ ﺩﺭ ﺳﻄﺢ ﺩﻭﻡ (ﺷﻬﺮﺳﺘﺎﻥ  ) ۰ ۹۴۱/  ﺑﺎ ﺧﻄﺎﻱ 

ﻣﻌﻴﺎﺭ p< /۰ ۰۰۱)  /۰ ۰۹۲) ﻭ ﻧﺴﺒﺖ ﺷﺎﻧﺲ ﺍﺭﺗﻔﺎﻉ ﺍﺯ ﺳﻄﺢ ﺩﺭﻳﺎ (۲۷/۱  ﻭ ۷۸/۰ ۶۲/۱ ﺑﻪ) ﺩﺳﺖ ﺁﻣﺪ. ﺩﺭ ﺭﮔﺮﺳﻴﻮﻥ ﺳﻪﺳﻄﺤ  ﻲ

ﻧﺴﺒﺖ ﺷﺎﻧﺲ ﺍﺑﺘﻼ ﺑﻪ ﮔﻮﺍﺗﺮ ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺩﺧﺘﺮ ۰۸/۱  (  ﻭ ۰۴/۱ ۳۴/۱ ) ﻭ ﺭﻭﺳﺘﺎﻳﻲ ۳۶/۱  (  ﻭ ۲۴/۱ ۴۷/۱ ) ﻣﻌﻨﻲﺩﺍﺭ ﺑﻮﺩ. 

ﻣﻘﺪﺍﺭ ﻭﺍﺭﻳﺎﻧﺲ ﺩﺭ ﺳﻄﺢ ﺳﻮﻡ (ﺍﺳﺘﺎﻥ  )ﻫﺎ ۱ ۰۳۱/  ﺑﺎ ﺧﻄﺎﻱ ﻣﻌﻴﺎﺭ ۰  ۲۸۷/ ﺑﺮﺁﻭﺭﺩ ﺷﺪ ( p< /۰ ۰۰۱ ﻴﻧﺘ .) ﺮﻴﮔ ﺠﻪ ﻱ ﻳ:  ﻫﺎ ﺎﻓﺘﻪ ﻧﺸﺎﻥ

ﺩﺍﺩ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﻣﺪﻝ ﺭﮔﺮﺳﻴ  ﻮﻥ ﮐﻼﺳﻴﮏ ﻣ ﻨﺠﺮ  ﺑﻪ  ﮐﻢ ﺑﺮﺁﻭﺭﺩﻱ ﻳﻭﺍﺭ ﺎﻧﺲ ﺑﺮﺁﻭﺭﺩ ﻣﺘﻐﻴﺮﻫﺎ ﻧﺴﺒﺖ ﺑﻪ ﻣﺪﻝﻫﺎﻱ ﺩﻭﺳﻄﺤﻲ ﻭ 

 ﺳﻪﺳﻄﺤﻲ  ﻲﻣ ﺷﻮﺩ   . 

  

ﻭﺍﮊﮔﺎﻥ ﻛﻠﻴﺪﻱ  : ﻣﺪﻝ ﭼﻨﺪﺳﻄﺤﻲ، ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ، ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒﻲ، ﮔﻮﺍﺗﺮ  

۸۹   : ۱/۴/ ﻣﻘﺎﻟﻪ ﭘﺬﻳﺮﺵ ـ ۸۹ ۲۷/۳/ :ﺍﺻﻼﺣﻴﻪ ﺩﺭﻳﺎﻓﺖ ـ ۸۸  ۱۰/ ۱۲/ :  ﻣﻘﺎﻟﻪ ﺩﺭﻳﺎﻓﺖ

ﻣﻘﺪﻣﻪ  

 ﻳﺪ ﻳﻚ ﻋﻨﺼﺮ ﺍﺳﺎﺳﻲ ﺑﺮﺍﻱ ﺑﻘﺎﻱ ﺍﻧﺴﺎﻥ ﺍﺳﺖ.  ﺍﻳﻦ ﻣﺎﺩﻩ  ﻱ 

ﻏﺬﺍﻳﻲ ﺑﺮﺍﻱ ﺭﺷﺪ  ﻭ ﻧﻤﻮ ﻓﺮﺩ، ﺣﺘﻲ ﻗﺒﻞ  ﺍﺯ ﺗﻮﻟﺪ ﻧﻴﺰ ﻣﻮﺭﺩ ﻧﻴﺎﺯ

ﺍﺳﺖ. ﻛﻤﺒﻮﺩ  ﺍﺯ ﻳﺪ ﻃﺮﻳﻖ ﺍﻳﺠﺎﺩ ﺍﺧﺘﻼﻝ  ﺩﺭ ﺭﺷﺪ  ﻭ ﺗﻜﺎﻣﻞ ﻣﻐﺰ،

ﻣﻴﻠﻴﻮﻥ  ﻫﺎ ﻧﻔﺮ  ﺍﺯ ﺳﺎﻛﻨ  ﻥﺎ  ﻱ ﻛﺮﻩ ﺯﻣﻴﻦ  ﺭﺍ  ﺩﺭ ﻣﻌﺮﺽ ﺧﻄﺮ ﻗﺮﺍﺭ

ﺩﺍﺩﻩ ﺍﺳﺖ.  ﺑﺮ ﺍﺳﺎﺱ ﮔﺰﺍﺭﺵ ﺳﺎﺯﻣﺎﻥ ﺟﻬﺎﻧﻲ ﺑﻬﺪﺍﺷﺖ  ﺣﺪﻭﺩ

ﻳﻚ ﻣﻴﻠﻴﺎﺭﺩ  ﻭ ﺷﺸﺼﺪ ﻣﻴﻠﻴﻮﻥ ﻧﻔﺮ ﺑ ﺩﺭ ﻴﺶ  ﺍﺯ ۱۳۰ ﻛﺸﻮﺭ

ﺟﻬﺎﻥ  ،  ﺩﺭ ﻣﻌﺮﺽ ﺧﻄﺮ ﺍﺑﺘﻼ  ﺑﻪ ﺍﺧﺘﻼﻝﻫﺎﻱ ﻧﺎﺷﻲ  ﺍﺯ ﻛﻤﺒﻮﺩ  ﻳﺪ 

ﻫﺴﺘﻨﺪ ۷۵۰ ﻣﻴﻠﻴﻮﻥ ﻧﻔﺮ (۱۳% ﺟﻤﻌﻴﺖ ﺟﻬﺎﻥ) ﺑﻪ ﮔﻮﺍﺗﺮ ﺩﭼﺎﺭﻧﺪ

 ﻭ ﻧﺰﺩﻳﻚ  ﺑﻪ  ۵۰ ﻣﻴﻠﻴﻮﻥ ﻧﻔﺮ ﻧﻴﺰ ﺩﺭﺟﻪﻫﺎﻳﻲ  ﺍﺯ ﺁﺳﻴﺐﻫﺎﻱ

ﻣﻐﺰﻱ ﻧﺎﺷﻲ  ﺍﺯ ﺍﺧﺘﻼﻝ ﮐﻤﺒﻮﺩ ﺪﻳ  (IDD)  ﺭﺍ ﻧﺸﺎﻥ  ﻣﻲﺩﻫﻨﺪ.

۱

ﮔﻮﺍﺗﺮ ﺑﻪ ﺑﺰﺭﮒﺗﺮ ﺷﺪﻥ ﻏﺪﻩﻱ ﻴ ﺗ ﺮﻭﺋﻴﺪ ﺍﺯ ﺣﺪ ﻃﺒ ﻌﻴ ﻲ ﺁﻥ ﺍﻃﻼﻕ 

ﻣ  ﻲﺷﻮﺩ. ﺳﻮﻣ ﻳﭘﺎ ﻦﻴ ﺶ ﮐﻤﺒﻮﺩ  ﻭ ﺪﻳ ﮔﻮﺍﺗﺮ ﮐﻮﺩﮐﺎﻥ ﻳﺍ ﺩﺭ  ﺮﺍﻥ

      ۳۶۰ ﻣﺠﻠﻪ  ﻱ ﻏﺪﺩ ﺩﺭﻭﻥ  ﻭ ﺭﻳﺰ ﻣﺘﺎﺑﻮﻟﻴﺴﻢ ﺍﻳﺮﺍﻥ ﺩﻭﺭﻩﻱ ﺩﻭﺍﺯﺩﻫﻢ, ﺷﻤﺎﺭﻩ ، ۴ ﻱ ﺁﺑﺎﻥ ۱۳۸۹

 ﺩﺭ ﺳﺎﻝ ۱۳۸۶  ﺑﻪ ﺍﻧﺠﺎﻡ  .ﺪﻴﺭﺳ ﻣﺎﺭﻱ ﻳ ﻧﻮ ﮏ ﻣﻄﺎﻟﻌﻪ ﺑﻪ ﺭﻭﺵ 

ﺗﻮﺻ ﻲﻔﻴ -ﺗﺤﻠ  ﻲﻠﻴ  ﺩﺭ ۲۶۰۰ ﮐﻮﺩﮎ ۱۲-۶  ﺳﺎﻟﻪﻱ  ﺳﺎﮐﻦ ﭼﻬﺎﺭ 

ﻣﻨﻄﻘﻪﻱ ﻴ ﻏ ﺮ ﺳﺎﺣﻠﻲ ﺎﻟﻳﺘ ﺍ ﻴﺎﻱ ﻣﺮﻛﺰﻱ ﺩﺭ ﺳﺎﻝ ۲۰۰۶ ﺍﻧﺠﺎﻡ ﺩﺍﺩ

ﻭ ﻭﺟﻮﺩ ﮔﻮﺍﺗﺮ ﻭ ﺩﺭﺟﻪﻱ  ﺁﻥ ﺭﺍ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺳﺎﺯﻣﺎﻥ 

ﺟﻬﺎﻧﻲ ﺑﻬﺪﺍﺷﺖ

i

(WHO) ﻣﺸﺨﺺ ﻭ ﺗﻌﻴﻴﻦ ﮐﺮﺩ. ﻣﻄﺎﻟﻌﻪ  ﻱ  ﻭﻱ

ﻧﺸﺎﻥ ﺩﺍﺩ ﻛﻪ ۹۵/۳ % ﮐﻮﺩﮐﺎﻥ ﻣﻨﺎﻃﻖ ﻏﻴﺮ ﺳﺎﺣﻠﻲ ﺩﭼﺎﺭ ﮔﻮﺍﺗﺮ 

ﻣ   ﻲﺑﺎﺷﻨﺪ ﻭ ﺷﻴﻮﻉ ﮔﻮﺍﺗﺮ ﺩﺭ ﻣﻨﺎﻃﻖ ﻏﻴﺮ ﺳﺎﺣﻠﻲ  ﻧﺴﺒﺖ ﺑﻪ 

ﻣﻨﺎﻃﻖ ﺳﺎﺣﻠﻲ ﻴ ﺑ ﺸﺘﺮ ﺍﺳﺖ.

۲

  

ﻭﺍﮊﻩﻱ ﭼﻨﺪﺳﻄﺤﻲ  ﺑﻪ ﺍﺭﺗﺒﺎﻁ ﺑﻴﻦ ﺍﻋﻀﺎﻱ ﻭﺍﺣﺪﻫﺎﻱ

ﺳﻠﺴﻠﻪ ﻣﺮﺍﺗﺒﻲ  ﺩﺭ ﻳﻚ ﺳﻴﺴﺘﻢ ﺍﺷﺎﺭﻩ ﺩﺍﺭﺩ  ﺑﻪ. ﻋﻨﻮﺍﻥ ﻣﺜﺎﻝ،  ﺩﺭ

ﺑﺮﺭﺳﻲ ﻴﻣ ﺰﺍﻥ ﺷﻴﻮﻉ ﮔﻮﺍﺗﺮ ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﮐﺸﻮﺭ  ﺑﺎ 

ﻭﺿﻌ ﺖﻴ ﭼﻨﺪﺳﻄﺤﻲ ﻣﻮﺍﺟﻪ ﻫﺴﺘ ﻢﻴ ﺑﻪ ﻦﻳﺍ ﺗﺮﺗ ﺐﻴ  ﮐﻪ

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ  ﻫﺮ ﻣﺪﺭﺳﻪ  ﺍﺯ ﻧﻈﺮ ﺧﺼﻮﺻﻴ  ﺎﺕ ﻣﺨﺘﻠﻒ ﺆﻣ  ﺑﺮ ﺛﺮ

ﮔﻮﺍﺗﺮ  ، ﻣﺸﺎﺑﻬﺖﻫﺎ  ﻳﻲ ﺩﺍﺭﻧﺪ  ﮐﻪ ﻣﻤﮑﻦ ﺍﺳﺖ  ﺑﺎ ﻣﺪﺭﺳﻪﻱ ﻳﺩ  ﮕﺮ

ﻫﻤﺎﻥ ﻣﻨﻄﻘﻪ ﻣﺘﻔﺎﻭﺕ ﺑﺎﺷﺪ.  ﺩﺭ ﻳ ﮏ ﺳﻄﺢ ﺑﺎﻻﺗﺮ،  ﻦﻴﺑ 

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﻳ ﮏ ﺷﻬﺮﺳﺘﺎﻥ ﻣﺸﺎﺑﻬﺖﻫﺎ ﻳﻲ ﻭﺟﻮﺩ ﺩﺍﺭﺩ  ﮐﻪ

ﻣﻤﮑﻦ ﺍﺳﺖ ﻭﺿﻌ ﺖﻴ ﻲﮐﻠ ﺁﻧﻬﺎ  ﺑﺎ ﺩﺍﻧﺶ ﺁﻣﻮﺯﺍﻥ ﺷﻬﺮﺳﺘﺎﻥ

ﻳﺩ  ﮕﺮ  ﺩﺭ ﻫﻤﺎﻥ ﺍﺳﺘﺎﻥ ﻣﺘﻔﺎﻭﺕ ﺑﺎﺷﺪ.  ﻦﻴﻫﻤ ﺣﺎﻟﺖ ﻣﻤﮑﻦ ﺍﺳﺖ

 ﺩﺭ ﺍﺳﺘﺎﻥ ﻱﻫﺎ ﻣﺨﺘﻠﻒ ﺍﺗﻔﺎﻕ ﺑﻴ ﻔﺘﺪ  . ﺑﻨﺎﺑﺮﺍ  ،ﻦﻳ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ،

ﻣﺪﺍﺭﺱ، ﺷﻬﺮﻫﺎ ﻭ ﺍﺳﺘﺎﻥﻫﺎ ﻴﺳ ﺴﺘﻢ ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒﻲ  ﺎﻳ 

ﭼﻨﺪﺳﻄﺤ  ﺭﺍ ﻲ ﺗﺸﮑ ﻣ ﻞﻴ  ﻲﺩﻫﻨﺪ  ﮐﻪ  ﺩﺭ  ﻫﺮ ﺳﻄﺢ،  ﻦﻴﺑ ﻧﻤﻮﻧﻪ  ﻫﺎ 

ﻫﻤﺒﺴﺘﮕ  ﻲ ﻭﺟﻮﺩ ﺩﺍﺭﺩ    .  

 ﺩﺭ  ﺩﺍﺩﻩﻫﺎﻱ  ﺑﺎ ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒﻲ،  ﻣﺪﻝﻫﺎﻱ ﺭﮔﺮﺳﻴﻮﻥ

ﻣﻌﻤﻮﻟﻲ  ﺑﻪ ﺩﻟﻴﻞ ﻧﺎﺩﻳﺪﻩ ﮔﺮﻓﺘﻦ ﺗﻐﻴﻴﺮﺍﺗﻲ  ﺑﻪ ﻛﻪ ﻭﺍﺳﻄﻪ  ﻱ 

ﺳﻄﻮﺡ ﻣﺨﺘﻠﻒ ﺍﻳﺠﺎﺩ  ﻣﻲﺷﻮﺩ  ، ﻣﻤﻜﻦ ﺍﺳﺖ ﺍﺳﺘﻨﺒﺎﻁﻫﺎﻱ

ﻧﺎﺩﺭﺳﺘﻲ  ﺑﻪ ﺩﺳﺖ ﺩﻫﻨﺪ.  ﻦﻳﺍ ﻞﻳﺩﻻ ﻣﻮﺿﻮﻉ ﻣ ﺭﺍ  ﻲﺗﻮﺍﻥ  ﺩﻭ

ﻓﺮﺽ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪﺷﺪﻩ ﺑﺮﺍﻱ ﺭﮔﺮﺳﻴﻮﻥ ﻣﻌﻤﻮﻟﻲ ﺷﺎﻣﻞ

ﺍﺳﺘﻘﻼﻝ ﻣﺸﺎﻫﺪ  ﻭ ﺎﻫ ﻩ ﻧﺎﻫﻤﺒﺴﺘﮕﻲ ﺧﻄﺎﻱ ﻣﺪﻝ ﺩﺍﻧﺴﺖ.

۳

 ﺮﺍﻳﺯ 

ﭼﻨﺎﻥ  ﭼﻪ ﻭﺍﺭﻳﺎﻧﺲ ﺑﺎﻗﻲﻣﺎﻧﺪﻩ  ﻫﺎ  ﺩﺭ ﻣﺸﺎﻫﺪ  ﻱﺎﻫ ﻩ ﻓﺮﺩﻱ ﻫﻤﺒﺴﺘﻪ

ﺑﺎﺷﻨﺪ،   ﺑﻪ ﻛﺎﺭﮔﻴﺮﻱ ﺭﮔﺮﺳﻴﻮﻥ ﻣﻌﻤﻮﻟﻲ ﻧﺎﻣﻨﺎﺳﺐ ﺧﻮﺍﻫﺪ ﺑﻮﺩ  .

ﺑﻪ ﻋﻨﻮﺍﻥ ﻣﺜﺎﻝ، ﺑﺎﺭﺩﻧﻬﻴﺮ ﻭ ﻫﻤﮑﺎﺭﺍﻥ ﺩﺭ ﺳﺎﻝ ۲۰۰۵ ﻣﻄﺎﻟﻌﻪﺍﻱ 

ﺩﺭ ﺍﺭﺗﺒﺎﻁ ﺑﺎ ﻣﺼﻮﻧﻴﺖ ﻭ ﺍﻳﻤﻦﺳﺎﺯﻱ ﺩﺭ ﺧﺎﻧﻪﻫﺎﻱ ﺳﺎﻟﻤﻨﺪﺍﻥ 

ﺩﺭ ﺑﺮﺍﺑﺮ ﺫﺍﺕﺍﻟﺮﻳﻪ ﺍﻧﺠﺎﻡ ﺩﺍﺩﻧﺪ ﻭ ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺳﺎﺧﺘﺎﺭ 

ﭼﻨﺪﺳﻄﺤﻲ ﺩﺍﺩﻩﻫﺎ ﻭ ﻫﻤﺒﺴﺘﮕﻲ ﻴ ﺑ ﻦ ﺳﻄﻮﺡ ﻣﺨﺘﻠﻒ، ﺑﺎ ﮐﻤﮏ 

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ ﭼﻨﺪﺳﻄﺤﻲ ﻣﻘﺎﻳﺴ ﻪﻫﺎﻳﻲ ﺩﺭ ﻣﻨﺎﻃﻖ 

ﻣﺨﺘﻠﻒ ﺟﻐﺮﺍﻓﻴﺎﻳﻲ ﺑﻪ ﻋﻤﻞ ﺍﻭﺭﺩﻧﺪ.

۴

  

                                                          

i - World Health Organization 

 ﺑﺎ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺍﻳﻦ ﻧ  ﻜﺘﻪ  ﻛﻪ ﻧﺎﺩﻳﺪﻩ ﮔﺮﻓﺘﻦ ﻫﻤﺒﺴﺘﮕﻲﻫﺎﻱ

ﺑﻴﻦ ﺳﻄﻮﺡ، ﺑﺎﻋﺚ ﺍﻓﺰﺍﻳﺶ ﺳﻬﻢ ﺧﻄﺎﻱ ﻧﻮﻉ ﺍﻭﻝ  ﻣﻲﺷﻮﺩ،  ﺑﻪ 

ﻧﻈﺮ  ﻣﻲﺭﺳﺪ  ﺩﺭ  ﺩﺍﺩﻩﻫﺎﻱ  ﺑﻪ ﺷﻜﻞ ﺳﻠﺴﻠﻪ  ﻣﺮﺍﺗﺒﻲ ﺍﺳﺘﻔﺎﺩﻩ  ﺍﺯ 

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ ﭼﻨﺪﺳﻄﺤﻲ ﻛﻪ ﺗﻮﺍﻧﺎﻳﻲ ﻟﺤﺎﻅ ﮐﺮﺩﻥ

ﻫﻤﺒﺴﺘ  ﮕﻲ ﺑﻴﻦ ﺳﻄﻮﺡ  ﺭﺍ ﺩﺍﺭﺩ ﺤﻟ ﺑﺎ ﻭ  ﺎﻅ ﮐﺮﺩﻥ ﻴﻴﺗﻐ ﺮﻳﺮﭘﺬ  ﻱ  ﺩﺭ

ﻴﻣ ﺎﻥ ﺧﻮﺷﻪ  ﻫﺎ ﺍﻃﻼﻋﺎﺕ ﻴﺑ ﺸﺘﺮﻱ ﻓﺮﺍﻫﻢ ﻣ  ﻲﺁﻭﺭﺩ ﻣﻨﺎﺳﺐ  ﺗﺮ 

ﺑﺎﺷﺪ.

۵

ﺍﺯ ﻃﺮﻓ  ﻲ، ﭼﻨﺎﻥ  ﭼﻪ ﺩﺭ ﺗﺤﻠ ﻞﻴ ﻫﺎ ﺩﺍﺩﻩ ﻳﻲ  ﮐﻪ ﺩﺍﺭﺍ  ﻱ

ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪ ﻣﺮﺍﺗﺒ  ﻲ ﻫﺴﺘﻨﺪ  ﻦﻳﺍ ﺳﺎﺧﺘﺎﺭ ﻟﺤﺎﻅ ﻧﺸﻮﺩ  ، ﻣﻤﮑﻦ

ﺍﺳﺖ ﺧﻄﺎﻱ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺐﻳﺿﺮﺍ ﺭﮔﺮﺳﻴ ﻲﻮﻧ ﮐﻤﺘﺮ  ﺍﺯ ﻣﻘﺪﺍﺭ

ﻌﻭﺍﻗ  ﻲ ﺑﺮﺁﻭﺭﺩ . ﺩﺷﻮ  ﺩﺭ ﺍﻳﻦ ﻣﻄﺎﻟﻌﻪ ﻣﺪﻝ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ

ﭼﻨﺪﺳﻄﺤﻲ  ﺑﺎ ﻣﺪﻝ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ ﻣﻌﻤﻮﻟﻲ  ﺩﺭ ﺗﻌﻴﻴﻦ

ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ ﻛﻮﺩﻛﺎﻥ ۱۰-۸ ﻱ ﺳﺎﻟﻪ ﺍﻳﺮﺍﻧﻲ  ﮐﻪ

ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪ ﻣﺮﺍﺗﺒ  ﻲ ﺩﺍﺭﻧﺪ، ﻣﻘﺎﻳﺴﻪ ﺷﺪﻧﺪ   .

  

ﻣﻮﺍﺩ  ﻭ ﺭﻭﺵ   ﻫﺎ

ﻱﻫﺎ ﺩﺍﺩﻩ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ  ﻦﻳﺍ ﺩﺭ ﭘﮋﻭﻫﺶ  ﺩﺭ ﺳﺎﻝ ۱۳۸۶

ﺗﻮﺳﻂ ﭘﮋﻭﻫﺸ ﻱ ﻜﺪﻩ ﻋﻠﻮﻡ ﻏﺪﺩ ﺩﺭﻭﻥﺭﻳﺰ ﻭ ﻣﺘﺎﺑﻮﻟﻴ  ﺴﻢ

ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﮑﻲ ﻭ ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ-  ﺩﺭﻣﺎﻧﻲ  ﺪﻴﺷﻬ

ﺑﻬﺸﺘ  ﺑﻪ ﻲ ﺭﻭﺵ ﻧﻤﻮﻧﻪ ﺮﻴﮔ  ﻱ ﺗﺼﺎﺩﻓ  ﻲ ﻃﺒﻘﻪ  ﻭ ﻱﺍ ﺧﻮﺷﻪ ﻱﺍ  ﺍﺯ  

 ۳۰ ﺍﺳﺘﺎﻥ ﻛﺸﻮﺭ  ﺟﻤﻊﺁﻭﺭﻱ . ﺷﺪ  ﺑﺮ ﺍﺳﺎﺱ ﻴﺷ  ﻮﻉ ﮔﻮﺍﺗﺮ ﺩﺭ 

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺍﺑﺘﺪﺍﻳﻲ  ﺩﺭ ﺳﺎﻝ ۸/۹ ۱۳۸۰ ﮐﻪ % ﺑﺮﺁﻭﺭﺩ ﺷﺪﻩ

ﺑﻮﺩ  ﺑﺎ  ﻭ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓ  ﺘﻦ ﺳﻄﺢ ﺍﻃﻤﻴﻨﺎﻥ ۹۵  ﻭ% ﺍﺛﺮ ﻃﺮﺡ  ،۵۵/۱

ﺗﻌﺪﺍﺩ ﻧﻤﻮﻧﻪ ﺑﺮﺍ  ﻱ  ﻫﺮ ﺍﺳﺘﺎﻥ ۶۰۰ ﻧﻔﺮ  ﺑﻪ ﺩﺳﺖ ﺁﻣﺪ.

۶

 ﺑﺎ ﺗﻮﺟﻪ  ﺑﻪ 

 ﻦﻳﺍ  ﮐﻪ ﺑﺮﺁﻭﺭﺩ  ﺩﺭ ﻣﻨﺎﻃﻖ ﺷﻬﺮﻱ  ﻭ ﺭﻭﺳﺘﺎ  ﻳﻲ ﻣﻮﺭﺩ ﻧﻈﺮ ﺑﻮﺩ  ،

 ﺩﺭ  ﻫﺮ ﺍﺳﺘﺎﻥ ۱۲۰۰ ﻧﻤﻮﻧﻪ ﺍﻧﺘﺨﺎﺏ  ﺷﺪ  ﮐﻪ  ﺩﺭ ﻣﺠﻤﻮﻉ   ، ۳۶۰۰۰

ﺩﺍﻧﺶﺁﻣﻮﺯ ۱۰-۸ ﺳﺎﻟﻪ ﺩﺭ ﻗﺎﻟﺐ ۱۸۰۰ ﺧﻮﺷﻪ ۲۰ ﻧﻔﺮﻱ

ﺍﻧﺘﺨﺎﺏ ﮔﺮﺩﻳﺪﻧﺪ.  ﺗﻌﺪﺍﺩ ۲۵۳ ﻧﻔﺮ  ﻞﻴﺩﻟ ﺑﻪ ﻧﺎﻗﺺ ﺑﻮﺩﻥ  ﻫﺎ ﺩﺍﺩﻩ

ﺍﺯ ﭘﮋﻭﻫﺶ ﺣﺬﻑ ﺷﺪﻧﺪ. ﻣﺘﻐﻴﺮﻫﺎﻱ ﺟﻨﺲ، ﻣﺤﻞ ﺳﮑﻮﻧﺖ،

ﺳﺎﺣﻠﻲ ﺑﻮﺩﻥ ﺍﺳﺘﺎﻥ  ، ﺍﺭﺗﻔﺎﻉ ﻣﺮﮐﺰ ﺍﺳﺘﺎﻥ  ﺍﺯ ﺳﻄﺢ ﺩﺭﻳﺎ  ﻭ 

ﺷﻴﻮﻩ  ﻱ ﻧﮕﻬﺪﺍﺭﻱ ﻧﻤﻚ ﻳ ﺪﺩﺍﺭ  ﺩﺭ ﺧﺎﻧﻮﺍﺩﻩ  ﻫﺎ ﻣﻮﺭﺩ ﺑﺮﺭﺳﻲ ﻗﺮﺍﺭ

ﮔﺮﻓﺖ  ﺑﺎ ﻭ ﮐﺪﻫﺎ  ﻭ ﻧﻤﺎﺩﻫﺎ  ﺮﻳﺯ ﻱ  ﺩﺭ  ﻫﺎ ﻣﺪﻝ ﻭﺍﺭﺩ :ﺷﺪ   

ﺟﻨﺲ (ﺩﺧﺘﺮ ، ۱= ﭘﺴﺮ )X1:  =۰

ﻣﺤﻞ ﺳﻜﻮﻧﺖ (ﺭﻭﺳﺘﺎ  ،۱= ﺷﻬﺮ )X2: =۰

ﺳﺎﺣﻠﻲ ﺑﻮﺩﻥ ﺍﺳﺘﺎﻥ (ﺳﺎﺣﻠﻲ  ﺮﻴﻏ ،۱= ﺳﺎﺣﻠﻲ )X3: =۰

ﺍﺭﺗﻔﺎﻉ  ﺍﺯ ﺳﻄﺢ ﺩﺭﻳﺎ ﻴﺑ ( ﺸﺘﺮ  ﺍﺯ ۱۳۰۰ ﻣﺘﺮ ، ۱= ﮐﻤﺘﺮ  ﺍﺯ 

= ۰( ﻣﺘﺮ ۱۳۰۰

X4:

ﺷﻴﻮﻩﻱ ﻧﮕﻬﺪﺍﺭﻱ ﻧﻤﻚ  ﻳﺪﺩﺍﺭ  (ﺭﻭﺵ ﻧﺎﻣﻨﺎﺳﺐ  ،۱=

ﺭﻭﺵ ﻣﻨﺎﺳﺐ )۰=

X5:ﺭﺿﻮﺍﻧﻪ ﭼﺮﺍﻏﻲ ﻭ  ﻫﻤﻜﺎﺭﺍﻥ ﺭﮔﺮﺳﻴﻮﻥ ﭼﻨﺪﺳﻄﺤﻲ ﺩﺭ ﺗﻌﻴﻴﻦ ﻋﻮﺍﻣﻞ ﮔﻮﺍﺗﺮ  ۳۶۱

ﺷﻴﻮﻩﻱ  ﻧﮕﻬﺪﺍﺭﻱ  ﻧﻤﮏ ﻳﺪﺩﺍﺭ ﺩﺭ ﺧﺎﻧﻮﺍﺩﻩ ﻳ ﻫﺎ ﮏ ﻣﺘﻐﻴﺮ 

ﻃﺒﻘﻪﺑﻨﺪﻱ  ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺑﻪ ﺩﻭ ﻃﺒﻘﻪﻱ  ﻧﮕﻬﺪﺍﺭﻱ  ﻣﻨﺎﺳﺐ ﻭ 

ﻧﮕﻬﺪﺍﺭﻱ ﻧﺎﻣﻨﺎﺳﺐ ﺗﻘﺴ  ﻢﻴ ﺑﻨﺪ  ﻱ  ﻣﻲﺷﻮﺩ. ﺑﺮﺍ  ﻱ ﻱ ﻫﻤﻪ  ﺍﺳﺘﺎﻥﻫﺎ، 

ﻧﺤﻮﻩﻱ  ﻧﮕﻬﺪﺍﺭﻱ ﻧﻤﮏ ﻳﺪﺩﺍﺭ ﺩﺭ ﺧﺎﻧﻮﺍﺩﻩﻫﺎ ﺭﻭﻳﺖ ﺷﺪ.  ﺍﮔﺮ 

ﺧﺎﻧﻮﺍﺩﻩﻫﺎ ﻧﻤﮏ ﺭﺍ ﺩﺭ ﺟﺎﻱ ﻣﺮﻃﻮﺏ، ﻣﻘﺎﺑﻞ ﻧﻮﺭ ﻣﺴﺘﻘﻴﻢ ﺁﻓﺘﺎﺏ 

ﻳﺎ  ﺩﺭ ﻇﺮﻑ ﻱﻫﺎ ﻴ ﺷ ﻱﺍ ﺸﻪ  ﮐﻪ ﻧﻮﺭ ﺍﺯ ﺁﻧﻬﺎ ﻋﺒﻮﺭ ﻣﻲ  ﮐﻨﺪ 

ﻧﮕﻬﺪﺍﺭﻱ  ﻣﻲﻛﺮﺩﻧﺪ، ﺷﻴﻮﻩﻱ  ﻧﺎﻣﻨﺎﺳﺐ ﺑﻮﺩ  ﻭ ﺩﺭ ﻏﻴﺮ ﺍ  ﻦﻳ

ﺻﻮﺭﺕ ﺷﻴﻮﻩﻱ  ﻧﮕﻬﺪﺍﺭﻱ ﻣﻨﺎﺳﺐ ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪ.  ﺍﺯ ﻧﻈﺮ 

ﺟﻐﺮﺍﻓ ﺎﻴ ﻳﻲ ﺩﺭ ﺑﻴﻦ ﮐﻞ ﺍﺳﺘﺎﻥ ﻱﻫﺎ  ﮐﺸﻮﺭ، ﺷﺶ ﺍﺳﺘﺎﻥ ﺳﺎﺣﻠ  ﻲ

ﻭﺟﻮﺩ ﺩﺍﺭﺩ ﮐﻪ ﺍﺳﺘﺎﻥ ﻱﻫﺎ  ﻣﺎﺯﻧﺪﺭﺍﻥ، ﻴﮔ ﻼﻥ، ﮔﻠﺴﺘﺎﻥ ﺩﺭ ﺷﻤﺎﻝ 

ﮐﺸﻮﺭ ﻭ ﺍﺳﺘﺎﻥﻫﺎ ﻱ ﻫﺮﻣﺰﮔﺎﻥ، ﺑﻮﺷﻬﺮ، ﺧﻮﺯﺳﺘﺎﻥ ﺩﺭ ﺟﻨﻮﺏ 

ﮐﺸﻮﺭ ﻗﺮﺍﺭ ﺩﺍﺭﻧﺪ. ﻴﻣﺘﻐ ﺮ ﺳﺎﺣﻠﻲ ﺑﻮﺩﻥ ﺍﺳﺘﺎﻥ ﻣﺤﻞ ﺳﮑﻮﻧﺖ  ،

ﻳﮏ ﻣﺘﻐﻴﺮ ﻃﺒﻘﻪﺑﻨﺪﻱ ﺷﺪﻩ ﺍﺳﺖ ﮐﻪ ﺑﻪ ﺩﻭ ﻃﺒﻘﻪﻱ  ﺍﺳﺘﺎﻥ  ﻱﻫﺎ 

ﺳﺎﺣﻠﻲ  ﻭ ﺍﺳﺘﺎﻥ ﻱﻫﺎ ﻴ ﻏ ﺮ ﺳﺎﺣﻠﻲ  ﺗﻘﺴﻴﻢ  ﻣﻲﺷﻮﺩ.  ﻱﻫﺎ ﺩﺍﺩﻩ

ﺍﻳﻦ ﻣﻄﺎﻟﻌﻪ ﺩﺍﺭﺍﻱ ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒﻲ ﺑﻮﺩﻧﺪ  ﺑﺎ ﻭ ﺍﺳﺘﻔﺎﺩﻩ

 ﺍﺯ ﻣﺪﻝ ﭼﻨﺪﺳﻄﺤﻲ ﺗﺠﺰﻳﻪ ﻭ ﺗﺤﻠ ﺷ ﻞﻴ ﺪﻧﺪ.   ﺑﺎ ﺗﻮﺟﻪ  ﺑﻪ ﺧﻄﺎ  ﻱ

ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺑﺮﺁﻭﺭﺩ ﻣﺘﻐﻴﺮﻫﺎ  ﻭ ﻳﻭﺍﺭ ﺎﻧﺲ ﻣﺘﻐ  ﺮﻴ ﭘﺎﺳﺦ  ﺩﺭ ﺳﻄﻮﺡ

ﻣﺨﺘﻠﻒ،  ﻱﻫﺎ ﻣﺪﻝ ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ ﺩﻭﺳﻄﺤ  ﻭ ﻲ  ﺳﻪﺳﻄﺤ  ﻲ

 ﺑﻪ  ﻫﺎ ﺩﺍﺩﻩ ﺑﺮﺍﺯﺵ ﺩﺍﺩﻩ  ﺑﺎ ﻭ ﻳﺎﻓﺘﻪﻫﺎﻱ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴ  ﮏ

ﻣﻌﻤﻮﻟﻲ ﻳﻣﻘﺎ ﺴﻪ ﺷﺪ .ﻧﺪ

۲

ﺑﺮﺁﻭﺭﺩ ﭘﺎﺭﺍﻣﺘﺮﻫﺎﻱ  ﻱﻫﺎ ﻣﺪﻝ

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ  ﻭ ﺩﻭ  ﺳﻪﺳﻄﺤﻲ  ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ  ﺍﺯ ﺭﻭﺵ  

(PQL)

i

  ﺑﻪﺩﺳﺖ ﺁﻣﺪ.  ﻧﺮﻡﺍﻓﺰﺍﺭ ﺁﻣﺎﺭﻱ MLWin ﺑﺮﺍﻱ ﺗﺤﻠ  ﻞﻴ

 ﻫﺎ ﺩﺍﺩﻩ ﺍﺳﺘﻔﺎﺩﻩ   .ﺷﺪ

ﻳﺎﻓﺘﻪ   ﻫﺎ

 ﺍﺯ ﻣﺠﻤﻮﻉ ۳۵۷۴۷ ﺩﺍﻧﺶ ﺁﻣﻮﺯ ﻣﻮﺭﺩ ﺑﺮﺭﺳﻲ  %۵/۶ ﺩﺍﺭﺍﻱ

ﺑﻴﻤﺎﺭﻱ ﮔﻮﺍﺗﺮ ﺑﻮﺩﻧﺪ.   ﺑﺎ ﺗﻮﺟﻪ  ﻦﻳﺍ ﺑﻪ  ﮐﻪ ﺣﺠﻢ ﻧﻤﻮﻧﻪ  ﺩﺭ ﺗﻤﺎﻡ

ﺍﺳﺘﺎﻥ  ﻫﺎ ﺑﺮﺍﺑﺮ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﺷﺪﻩ ﺑﻮﺩ، ﭘﺲ  ﺍﺯ ﺗﻌﺪ ﻞﻳ  ﻧﺴﺒﺖ ﺑﻪ

ﻭﺯﻥ ﺟﻤﻌ ﻲﺘﻴ ﺍﺳﺘﺎﻥ  ﻫﺎ، ﺷﻴﻮﻉ ﮔﻮﺍﺗﺮ  ﺑﻪ %۷۴/۵ ﺩﺳﺖ ﺁﻣﺪ

(ﺟﺪﻭﻝ  ).۱ ﺑﺮﺍﺳﺎﺱ ﻳﺎﻓﺘﻪﻫﺎﻱ ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ ﻣﻌﻤﻮﻟ  ،ﻲ

ﺷﺎﻧﺲ ﺩﺍﺷﺘﻦ ﮔﻮﺍﺗﺮ ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺩﺧﺘﺮ ﻧﺴﺒﺖ  ﺑﻪ 

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﭘﺴﺮ  ﺑﺎ ۱۰/۱ ﻓﺎﺻﻠﻪﻱ ﺍﻃﻤﻴﻨﺎﻥ ۹۵% (  ﻭ ۴۶/۱

۰۳/۱ )  ﺑﻪ ﺩﺳﺖ ﺁﻣﺪ. ﺧﻄﺮ ﻣﺬﮐﻮﺭ  ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺭﻭﺳﺘﺎ  ﻳﻲ

۳۲/۱  ( ﻭ ۰۶/۱( ۵۱/۱  ﺑﺮﺍﺑﺮ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺷﻬﺮ  ﻱ ﺑﻮﺩ.  ﻫﻢ  ،ﻦﻴﭼﻨ

ﺧﻄﺮ ﺍﺑﺘﻼ  ﺑﻪ ﮔﻮﺍﺗﺮ  ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺳﺎﮐﻦ  ﺩﺭ ﺍﺳﺘﺎﻥﻫﺎ  ﻳﻲ  ﮐﻪ

ﻣﺮﮐﺰ ﺁﻧﻬﺎ  ﺩﺭ ﺍﺭﺗﻔﺎﻉ ﻴﺑ ﺸﺘﺮ  ﺍﺯ ۱۳۰۰ ﻣﺘﺮﻱ  ﺎﻳﺩﺭ ﻗﺮﺍﺭ ﺩﺍﺭﻧﺪ  ،

( ۸۰/۱ ﻓﺎﺻﻠﻪﻱ ﺍﻃﻤﻴﻨﺎﻥ  ﻭ ۲۳/۱ ۹۴/۱ ) ﺑﺮﺍﺑﺮ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻧ  ﻲ

                                                          

i

- Penalised Quasi Likelihood 

ﺑﻮﺩ  ﮐﻪ  ﺩﺭ ﺍﺳﺘﺎﻥﻫﺎ  ﺑﺎ ﻳﻲ ﺍﺭﺗﻔﺎﻉ ﮐﻤﺘﺮ ﺍﺯ ۱۳۰۰ ﻣﺘﺮ ﺍﺯ ﺳﻄﺢ 

ﺩﺭﻳﺎ ﺯﻧﺪﮔﻲ ﻣﻲﮐﻨﻨﺪ   . ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻧﻲ  ﮐﻪ ﺧﺎﻧﻮﺍﺭﻫﺎﻱ ﺁﻧﻬﺎ  ﺑﻪ 

ﻃﻮﺭ ﻧﺎﻣﻨﺎﺳﺐ  ﺍﺯ ﻧﻤﮏ ﻳ ﺪﺩﺍﺭ ﻧﮕﻬﺪﺍﺭ ﻣ ﻱ ﮐ ﻲ ﺮﺩ  ﻧﺪ  ﺩﺭ ﻳﻣﻘﺎ  ﺑﺎ ﺴﻪ

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺧﺎﻧﻮﺍﺭﻫﺎ  ﻳﻲ  ﺑﻪ ﮐﻪ ﻃﻮﺭ ﻣﻨﺎﺳﺐ  ﺍﺯ ﻧﻤﮏ ﻧﮕﻬﺪﺍﺭ  ﻱ

ﻣ ﮐ ﻲ ﺮﺩ  ﻧﺪ  ۵۱/۱ ﺑﺮﺍﺑﺮ  ﺑﺎ( ﻓﺎﺻﻠﻪ ﺍﻃﻤﻴﻨﺎﻥ  ﻭ ۲۷/۱ ۸۷/۱ ﻴﺑ)  ﺸﺘﺮ

ﻣﺒﺘﻼ  ﺑﻪ ﮔﻮﺍﺗﺮ ﺑﻮﺩﻧﺪ ﺑ.  ﺮﺧﻼﻑ ﺍﻧﺘﻈﺎﺭ، ﺧﻄﺮ ﺍﺑﺘﻼ  ﺑﻪ ﮔﻮﺍﺗﺮ  ﺩﺭ

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺳﺎﮐﻦ  ﺩﺭ ﺍﺳﺘﺎﻥ ﻱﻫﺎ ﺳﺎﺣﻠﻲ ۰۸/۲  (  ﻭ ۵۳/۲

۰۱/۲ ) ﺑﺮﺍﺑﺮ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺳﺎﮐﻦ  ﺩﺭ ﺍﺳﺘﺎﻥ  ﺮﻴﻏ ﻱﻫﺎ ﺳﺎﺣﻠ  ﺑﻪ ﻲ

ﺩﺳﺖ ﺁﻣﺪ (ﺟﺪﻭﻝ    ).۲ 

ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ ﺩﻭﺳﻄﺤ  ﻲ ﺑﺮﺍﻱ  ﺑﻪ ﻫﺎ ﺩﺍﺩﻩ ﺷﮑﻞ  ﺮﻳﺯ 

ﺍﺳﺖ    :

ij j X ij X ij X ij X ij

it

0 1 2 3 5

log (π ) = β + .0 064 .0( 055) + .0 302 .0( 049) + .0 727 .0( 188) + .0 277 .0( 161)

ﮐ ــــــــــﻪ ﺩﺭ ﺁﻥ

0 j U0 j

 ﻭ ﺍﺳـــــــﺖ β = − .3 119 .0( 146) +

( )

2

0 ~ ,0 U j N σ u

 ﻣ ﻲﺑﺎﺷﺪ. ﺑﺮﺁﻭﺭﺩ ﻣﻘﺪﺍﺭ ﻭﺍﺭﻳﺎﻧﺲ ﺩﺭ ﺳـﻄﺢ       

ﺩﻭﻡ  ﻲﻌﻨﻳ  ﺷﻬﺮﺳﺘﺎﻥ ﻫﺎ  ( )

2

σ u

 ﺑﺮﺍﺑـﺮ    ۰ ۹۴۱/  ﺑـﺎ ﺧﻄـﺎ  ﻱ ﻣﻌﻴـ ﺎﺭ 

۰ ۰۹۲/   ﺑﻪ ﺩﺳﺖ ﺁﻣﺪ ( p< /۰ ۰۰۱)  ﻛﻪ ﻧﺸﺎﻥ ﺩﻫﻨﺪﻩﻱ   ﻫﻤﺒـﺴﺘﮕﻲ   

ﻣﻌﻨﻲﺩﺍﺭ ﮔﻮﺍﺗﺮ ﺩﺭ ﺍﻓﺮﺍﺩ ﺳﺎﻛﻦ ﺩﺭ ﻫﺮ ﺷﻬﺮﺳﺘﺎﻥ ﺍﺳﺖ   .

ﺟﺪﻭﻝ -۱  ﺗﻮﺯﻳﻊ ﻓ  ﺮﺍﻭﺍﻧﻲ ﺩﺍﻧﺶ ﺁﻣﻮﺯﺍﻥ  ﺷﺮﻛﺖ  ﻛﻨﻨﺪﻩ ﺩﺭ ﭘـﮋﻭﻫﺶ   

ﺑﺮ ﺣﺴﺐ ﺩﺍﺷﺘﻦ ﮔﻮﺍﺗﺮ ﺑﻪ ﺗﻔﮑﻴﮏ ﻣﺘﻐﻴﺮﻫﺎﻱ ﻣﻮﺭﺩ ﺑﺮﺭﺳﻲ    

ﺩﺍﺭﺍ  ﻱ ﮔﻮﺍﺗﺮ ﺳﺎﻟﻢ

ﻣﺘﻐ ﺮﻴ

(ﺩﺭﺻﺪ) ﺗﻌﺪﺍﺩ (ﺩﺭﺻﺪ) ﺗﻌﺪﺍﺩ

۳۳۴۲۹ ۹۳( )۵/ ۲۳۱۸ )۵/۶( ﺍﻓﺮﺍﺩ ﮐﻞ 

ﺟﻨﺲ

۱۶۸۶۸ ۹۳( )۹/ ۱۱۰۵ )۱/۶( ﭘﺴﺮ

۱۶۵۶۱ ۹۳( )۲/ ۱۲۱۳ )۸/۶( ﺩﺧﺘﺮ

ﻣﺤﻞ ﺳﮑﻮﻧﺖ

۱۶۸۳۸ ۹۴( )۴/ ۱۰۰۷ )۶/۵( ﺷﻬﺮ

۱۶۵۹۱ ۹۲( )۷/ ۱۳۱۱ )۳/۷( ﺭﻭﺳﺘﺎ

ﻧﺤﻮﻩ ﻧﮕﻬﺪﺍﺭ  ﻱ ﻧﻤﮏ

۵۷۱۶ ۹۵( )۳/ ۲۸۴ )۷/۴( ﻣﻨﺎﺳﺐ

۲۷۷۱۳ ۹۳( )۲/ ۲۰۳۴ )۸/۶( ﻧﺎﻣﻨﺎﺳﺐ

ﺳﺎﺣﻠ  ﻲ ﺑﻮﺩﻥ ﺍﺳﺘﺎﻥ

۲۶۸۹۷ ۹۴( )۲/ ۱۶۵۰ )۸/۵( ﺳﺎﺣﻠﻲ ﺮﻴﻏ 

۶۵۳۲ ۹۰( )۷/ ۶۶۸ )۳/۹( ﺳﺎﺣﻠﻲ

ﺍﺭﺗﻔﺎﻉ  ﺍﺯ ﺳﻄﺢ ﺎﻳﺩﺭ

۱۷۷۳۶ ۹۳( )۶/ ۱۱۰۷ )۴/۶( ﻣﺘﺮ ۱۳۰۰ ﺍﺯ  ﮐﻤﺘﺮ

۱۵۶۹۳ ۹۳( )۴/ ۱۲۱۱ )۶/۶( ﻣﺘﺮ ۱۳۰۰ ﺸﺘﺮ ﺍﺯ  ﻴﺑ

* ﻣﻘﺪﺍﺭ P ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺁﺯﻣﻮﻥ ﻣﺠﺬﻭﺭ ﺧﻲ ﺑﺮﺍﻱ ﺟﻨﺲ ۰ ۰۰۹/  ﻭ ﺑﺮﺍﻱ ﺳﺎﻳﺮ 

ﻣﺘﻐﻴﺮﻫﺎ ۰ ۰۰۱/  ﺑﻪ ﺩﺳﺖ ﺁﻣﺪﻩ ﺍﺳﺖ    .۳۶۲ ﻣﺠﻠﻪ  ﻱ ﻏﺪﺩ ﺩﺭﻭﻥ  ﻭ ﺭﻳﺰ ﻣﺘﺎﺑﻮﻟﻴﺴﻢ ﺍﻳﺮﺍﻥ ﺩﻭﺭﻩﻱ ﺩﻭﺍﺯﺩﻫﻢ, ﺷﻤﺎﺭﻩ ، ۴ ﻱ ﺁﺑﺎﻥ ۱۳۸۹

ﺑﺮ ﺍﺳﺎﺱ ﻳﺎﻓﺘﻪﻫﺎﻱ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ ﺩﻭﺳﻄﺤ ،ﻲ  ﻧﺴﺒﺖ 

ﺷﺎﻧﺲ ( ﻭ ﻓﺎﺻﻠﻪﻱ  ﺍﻃﻤﻴﻨﺎﻥ  )%۹۵ ﺑﺮﺍﻱ ﺧﻄﺮ ﺍﺑﺘﻼ ﺑﻪ ﮔﻮﺍﺗﺮ 

ﺩﺭ ﺩﺍ  ﻧﺶﺁﻣﻮﺯﺍﻥ ﺩﺧﺘﺮ ۱۵/۱ )  ۰۶/۱ ﻭ ۰۱/۱ ) ﺑﺮﺍﺑﺮ 

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﭘﺴﺮ ﻭ ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺭﻭﺳﺘﺎ  ﻳﻲ  (۳۵/۱  ﻭ ۴۶/۱

۱۶/۱ ) ﺑﺮﺍﺑﺮ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺷﻬﺮﻱ ﺑﻮﺩ. ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ 

ﺧﺎﻧﻮﺍﺭﻫﺎﻳﻲ  ﮐﻪ ﺑﻪ ﻃﻮﺭ ﻧﺎﻣﻨﺎﺳﺐ ﺍﺯ ﻧﻤﮏ ﻳﺪﺩﺍﺭ ﻧﮕﻬﺪﺍﺭ  ﻱ

ﻣ ﮐ ﻲ ﺮﺩﻧﺪ ﺩﺭ ﻣﻘﺎﻳﺴﻪ ﺑﺎ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺧﺎﻧﻮﺍﺭﻫﺎﻳﻲ ﮐﻪ ﺑﻪ ﻃﻮﺭ 

ﻣﻨﺎﺳﺐ ﺍﺯ ﻧﻤﮏ ﻧﮕﻬﺪﺍﺭﻱ ﻣ ﮐ ﻲ ﺮﺩﻧﺪ ( ۳۱/۱  ﻭ ۰۵/۱ ۵۶/۱ ) ﺑﺮﺍﺑﺮ 

ﺑﻴﺸﺘﺮ ﺩﺭ ﻣﻌﺮﺽ ﺧﻄﺮ ﺍﺑﺘﻼ ﺑﻪ ﮔﻮﺍﺗﺮ ﺑﻮﺩﻧﺪ. ﺩﺭ ﺍﻳﻦ ﻣﺪﻝ 

ﻧﺴﺒﺖ ﺷﺎﻧﺲ ﻴﻣﺘﻐ ﺮ ﺍﺭﺗﻔﺎﻉ ﺍﺯ ﺳﻄﺢ ﺩﺭ ﺎ ﻳ (۲۷/۱  ﻭ ۷۸/۰ ( ۶۲/۱

ﺑﻮﺩ ﮐﻪ ﺍﺯ ﻧﻈﺮ ﺁﻣﺎﺭﻱ ﻣﻌﻨ  ﻲﺩﺍﺭ ﻧﻴ   .ﺴﺖ

ﻣﺪﻝ ﻧﻬﺎﻳﻲ ﺑﺎ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ  ﺳﻪﺳﻄﺤ  ﻲ

 ﺑﻪ ﺭﻭﺵ ( PQL  ﺑﻪ ) ﺻﻮﺭﺕ ﻪ ﺑ ﺮﻳﺯ ﺩﺳﺖ ﺁﻣﺪ   :

ijk jk X ijk X ijk

it

0 1 2

log (π ) = β + 86.0 .0( 057) + .0 312 .0( 050)

ﮐﻪ ﺩﺭ ﺁﻥ 

0 jk 0k u0 jk

 ﻭ  β = − .3 506 .0( 384) +ν +

( )

2

0 ~ ,0

k N v ( ) ﻭ   v σ

2

0 ~ ,0 ﺍﺳﺖ U j N σ u

. ﺍﻋﺪﺍﺩ ﺩﺍﺧﻞ 

ﭘﺮﺍﻧﺘﺰ ، ﺧﻄﺎﻱ ﻣﻌﻴﺎﺭ ﺑﺮﺁﻭﺭﺩ ﭘﺎﺭﺍﻣﺘﺮ ﺭﺍ ﻧﺸﺎﻥ ﻣﻲﺩﻫﺪ. ﺑﺮﺁﻭﺭﺩ 

ﻣﻘﺪﺍﺭ ﻭﺍﺭﻳﺎﻧﺲ ﺩﺭ ﺳﻄﺢ ﺳﻮﻡ ﻲﻌﻨﻳ  ﺍﺳﺘﺎﻥﻫﺎ ( )

2

σ v

 ﺑﺮﺍﺑﺮ 

۱ ۰۳۱/  ﺑﺎ ﺧﻄﺎﻱ ﻣﻌﻴﺎﺭ ۰ ۲۸۷/  ﺑﻪ ﺩﺳﺖ ﺁﻣﺪ ( p< /۰ ۰۰۱) ﻛﻪ 

ﻧﺸﺎﻥﺩﻫﻨﺪﻩﻱ  ﻫﻤﺒﺴﺘﮕﻲ ﻣﻌﻨﻲﺩﺍﺭ ﺍﻓﺮﺍﺩ ﺳﺎﻛﻦ ﺩﺭ ﻫﺮ ﺍﺳﺘﺎﻥ ﺍﺯ 

ﻧﻈﺮ ﺍﺑﺘﻼ ﺑﻪ ﮔﻮﺍﺗﺮ ﺍﺳﺖ  .  ﻫﻢ ،ﻦﻴﭼﻨ  ﺑﺮﺁﻭﺭﺩ ﻣﻘﺪﺍﺭ ﻭﺍﺭﻳﺎﻧﺲ ﺩﺭ 

ﺳﻄﺢ ﺩﻭﻡ ﻲﻌﻨﻳ  ﺷﻬﺮﺳﺘﺎﻥﻫﺎ ( )

2

 ﺑﺮﺍﺑﺮ ۰ ۱۸۵/  ﺑﺎ ﺧﻄﺎ  ﻱ σ u

ﻴﻣﻌ ﺎﺭ ۰ ۰۳۴/  ﺑﻪ ﺩﺳﺖ ﺁﻣﺪ ( p< /۰ ۰۰۱) ﻛﻪ ﻧﺸﺎﻥﺩﻫﻨﺪﻩ  ﻱ 

ﻫﻤﺒﺴﺘﮕﻲ ﻣﻌﻨﻲﺩﺍﺭ ﺑﻴﻦ ﺍﻓﺮﺍﺩ ﺳﺎﻛﻦ ﺩﺭ ﻫﺮ ﺷﻬﺮﺳﺘﺎﻥ  ﺑﺎ 

ﺩﺍﺷﺘﻦ ﮔﻮﺍﺗﺮ ﺍﺳﺖ   .  

  

ﺟﺪﻭﻝ  ـ۲ ﻳﺎﻓﺘﻪﻫﺎﻱ  ﺳﻪ ﻣﺪﻝ ﺭﮔﺮﺳﻴﻮﻧﻲ ﺑﺮﺍﻱ ﺑﺮﺭﺳﻲ ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ  

P-Value (95%CI)  OR β(SE)  ﺭﻭﺵ

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ ﻣﻌﻤﻮﻟﻲ     

/۰ ۰۱۴ ۰۳/۱( ۴۶/۱ﻭ ) ۱۰/۱ /۰ ۱۰۶ /۰( ۰۴۳) (ﺩﺧﺘﺮ) ﺟﻨﺲ

< /۰ ۰۰۱ ۰۶/۱( ۵۱/۱ﻭ ) ۳۲/۱ 

/۰ ۲۸۲ /۰( ۰۴۳) (ﺭﻭﺳﺘﺎ) ﺳﻜﻮﻧﺖ ﻣﺤﻞ

< /۰ ۰۰۱ ۰۱/۲( ۵۳/۲ﻭ ) ۰۸/۲ /۰ ۷۷۱ /۰( ۰۶۴) ﺍﺳﺘﺎﻥ ﺑﻮﺩﻥ ﺳﺎﺣﻠﻲ

۸۰/۱ /۰ ۳۷۶ /۰( ۰۵۷) (ﻣﺘﺮ ۱۳۰۰ ﺸﺘﺮ ﺍﺯ  ) ﻴﺑ ﺩﺭﻳﺎ ﺳﻄﺢ ﺍﺯ  ﺍﺭﺗﻔﺎﻉ ۰۰۱ ۲۳/۱( ۹۴/۱ﻭ ) < /۰

< /۰ ۰۰۱ ۲۷/۱( ۸۷/۱ﻭ ) ۵۱/۱ /۰ ۴۱۸ /۰( ۰۶۵) (ﻧﺎﻣﻨﺎﺳﺐ ﺭﻭﺵ) ﻧﻤﻚ ﻧﮕﻬﺪﺍﺭﻱ ﻱ  ﺷﻴﻮﻩ

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ ﺩﻭﺳﻄﺤﻲ

۰۱/۰ ۰۱/۱( ۱۵/۱ﻭ ) ۰۶/۱ /۰ ۰۶۴ /۰( ۰۵۵) (ﺩﺧﺘﺮ) ﺟﻨﺲ

  < /۰ ۰۰۱ ۱۶/۱( ۴۶/۱ﻭ ) ۳۵/۱ /۰ ۳۰۲ /۰( ۰۴۹) (ﺭﻭﺳﺘﺎ) ﺳﻜﻮﻧﺖ ﻣﺤﻞ

< /۰ ۰۰۱ ۰۱/۲( ۲۲/۲ﻭ ) ۰۶/۲ /۰ ۷۲۷ /۰( ۱۸۸) ﺍﺳﺘﺎﻥ ﺑﻮﺩﻥ ﺳﺎﺣﻠﻲ

۲۷/۱ /۰ ۲۴۶ /۰( ۱۶۵) (ﻣﺘﺮ ۱۳۰۰ ﺸﺘﺮ ﺍﺯ  ) ﻴﺑ ﺩﺭﻳﺎ ﺳﻄﺢ ﺍﺯ  ﺍﺭﺗﻔﺎﻉ ۰۶/۰ ۷۸/۰( ۶۲/۱ﻭ )

۰۴/۰ ۰۵/۱( ۵۶/۱ﻭ ) ۳۱/۱ /۰ ۲۷۷ /۰( ۱۶۱) (ﻧﺎﻣﻨﺎﺳﺐ ﺭﻭﺵ) ﻧﻤﻚ ﻧﮕﻬﺪﺍﺭﻱ ﻱ  ﺷﻴﻮﻩ

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﻚ  ﺳﻪ ﺳﻄﺤﻲ

/۰ ۰۸۶ /۰( ۰۵۷) (ﺩﺧﺘﺮ) ﺟﻨﺲ

  

۰۴/۱( ۳۴/۱ﻭ ) ۰۸/۱

   ۰۴/۰

< /۰ ۰۰۱ ۲۴/۱( ۴۷/۱ﻭ ) ۳۶/۱ /۰ ۳۱۲ /۰( ۰۵۰) (ﺭﻭﺳﺘﺎ) ﺳﻜﻮﻧﺖ ﻣﺤﻞ

۰۶/۰ ۹۸/۰( ۳۱/۲ﻭ ) ۱۹/۲ /۰ ۷۸۷ /۰( ۵۷۰) ﺍﺳﺘﺎﻥ ﺑﻮﺩﻥ ﺳﺎﺣﻠﻲ

۰۷/۱ /۰ ۰۷۶ /۰( ۴۶۱) (ﻣﺘﺮ ۱۳۰۰ ﺸﺘﺮ ﺍﺯ  ) ﻴﺑ ﺩﺭﻳﺎ ﺳﻄﺢ ﺍﺯ  ﺍﺭﺗﻔﺎﻉ ۴۳/۰ ۸۳/۰( ۴۲/۱ﻭ )

۱۷/۰ ۴۵/۰( ۸۴/۱ﻭ ) ۷۲/۱ /۰ ۴۸۹ /۰( ۵۲۷) (ﻧﺎﻣﻨﺎﺳﺐ ﺭﻭﺵ) ﻧﻤﻚ ﻧﮕﻬﺪﺍﺭﻱ ﻱ  ﺷﻴﻮﻩﺭﺿﻮﺍﻧﻪ ﭼﺮﺍﻏﻲ ﻭ  ﻫﻤﻜﺎﺭﺍﻥ ﺭﮔﺮﺳﻴﻮﻥ ﭼﻨﺪﺳﻄﺤﻲ ﺩﺭ ﺗﻌﻴﻴﻦ ﻋﻮﺍﻣﻞ ﮔﻮﺍﺗﺮ  ۳۶۳

  

 ﺩﺭ ﻣﺪﻝ ﺎﻧﻬ ﻳﻲ ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ  ﺳﻪﺳﻄﺤﻲ  ﺑﻪ ﺭﻭﺵ

PQL ﻧﺴﺒﺖ ﺷﺎﻧﺲ ﺍﺑﺘﻼ  ﺑﻪ ﮔﻮﺍﺗﺮ  ﺩﺭ ﺩﺍﻧﺶ ﺁﻣﻮﺯﺍﻥ ﺩﺧﺘﺮ

 ﺑﻪ  ﻧﺴﺒﺖ ( ۰۴/۱ ۳۴/۱ ﻭ  ۹۵% ) ﺍﻃﻤﻴﻨﺎﻥ ﻓﺎﺻﻠﻪﻱ ۰۸/۱ ﺑﺎ 

ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﭘﺴﺮ   ﺑﻪ ﺩﺳﺖ ﺁﻣﺪ. ﺧﻄﺮ ﻣﺬﮐﻮﺭ  ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ

ﺭﻭﺳﺘﺎ  ﻳﻲ ۳۶/۱  (  ﻭ ۲۴/۱ ۴۷/۱ ) ﺑﺮﺍﺑﺮ ﻴﺑ ﺸﺘﺮ  ﺍﺯ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ

ﺷﻬﺮﻱ ﺑﻮﺩ. ﺮﻴﻣﺘﻐ ﻱﻫﺎ ﺳﺎﺣﻠﻲ ﺑﻮﺩﻥ ﺍﺳﺘﺎﻥ ﻣﺤﻞ ﺳﮑﻮﻧﺖ  ،

ﺍﺭﺗﻔﺎﻉ  ﺍﺯ ﺳﻄﺢ ﻭ ﺎﻳﺩﺭ ﺷﻴﻮﻩﻱ ﻧﮕﻬﺪﺍﺭﻱ ﻧﻤﮏ ﻳ ﺪﺩﺍﺭ  ﺩﺭ

ﺧﺎﻧﻮﺍﺭ  ﺍﺯ ﻫﺎ ﻧﻈﺮ ﺁﻣﺎﺭ  ﻱ ﻣﻌﻨ   ﻲ  ﺩﺍﺭ ﻧﺒﻮﺩﻧﺪ   .

  

ﺑﺤﺚ  

 ﺩﺭ ﺍﻳﻦ ﻣﻄﺎﻟﻌﻪ ﺩﻭ ﺭﻭﺵ ﺁﻣﺎﺭﻱ ﺑﺮﺍﻱ ﺗﺤﻠ ﻞﻴ ﻋﻮﺍﻣﻞ

ﻣﺮﺗﺒﻂ  ﺑﺎ ﺍﺑﺘﻼ  ﺑﻪ ﮔﻮﺍﺗﺮ  ﺩﺭ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ ﺍﺳﺘﻔﺎﺩﻩ  ﺑﺎ ﻭ  ﻫﻢ

ﻣﻘﺎﻳﺴﻪ ﺷﺪﻧﺪ.   ﺍﺯ ﻣﺪﻝ ﺭﮔﺮﺳﻴﻮﻥ ﻟ ﺠﺴﺘﻴﻚ ﻣﻌﻤﻮﻟﻲ  ﺑﻪ ﻋﻨﻮﺍﻥ

ﻳﻚ ﻣﺪﻝ ﻛﻼﺳﻴﻚ ﺁﻣﺎﺭﻱ  ﻛﻪ ﻓﺮﺽ ﺍﺳﺘﻘﻼﻝ ﺑﻴﻦ ﻣﺸﺎﻫﺪ  ﺭﺍ ﺎﻫ ﻩ

 ﻣﻲﭘﺬﻳﺮﺩ  ﺑﻪ ، ﻋﻨﻮﺍﻥ ﻳﻜﻲ  ﺍﺯ ﺭﻭﺵﻫﺎﻱ ﺑﺮﺭﺳﻲ ﻋﻮﺍﻣﻞ ﻣﺆﺛﺮ  ﺑﺮ 

ﮔﻮﺍﺗﺮ ﺍﺳﺘﻔﺎﺩﻩ .ﺷﺪ

۳

 ﻫﻢﭼﻨﻴﻦ  ﺑﺎ ،  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﻭﺍﺑﺴﺘﮕﻲ ﻣﻴﺎﻥ

ﻣﺸﺎﻫﺪ  ﻩ  ﻫﺎ،  ﻣﺪﻝﻫﺎﻱ ﭼﻨﺪ ﺳﻄﺤﻲ  ﺑﻪ  ﺩﻭ ﺷﻜﻞ ﺩﻭﺳﻄﺤﻲ  ﻭ 

 ﺳﻪﺳﻄﺤﻲ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻗﺮﺍ  ﺭ ﮔﺮﻓﺖ ﻭ ﻣﺸﺎﻫﺪﻩ  ﺷﺪ  ﻛﻪ ﻣﺪﻝ

 ﺳﻪﺳﻄﺤﻲ  ﺑﺎ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ  ﭘﺎﻳﻪﻫﺎﻱ ﺩﻭﻡ  ﺗﺎ 

ﭼﻬﺎﺭﻡ ﺩﺑﺴﺘﺎﻥ  ﺑﻪ ﻋﻨﻮﺍﻥ ﺳﻄﺢ ﺍﻭﻝ ﻣﻄﺎﻟﻌﻪ  ﻭ ﺷﻬﺮﺳﺘﺎﻥ  ﺑﻪ ﻫﺎ 

ﻋﻨﻮﺍﻥ ﺳﻄﺢ ﺩﻭﻡ  ﻭ ﺍﺳﺘﺎﻥ  ﺑﻪ ﻫﺎ ﻋﻨﻮﺍﻥ ﺳﻄﺢ ﺳﻮﻡ ﻣﻄﺎﻟﻌﻪ

ﻣﺪﻝ ﻣﻨﺎﺳﺒﻲ ﺑﺮﺍﻱ ﺗﻌﻴﻴﻦ ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ ﺩﺍﻧﺶﺁﻣﻮﺯﺍﻥ

ﻫﺴﺘﻨﺪ، ﺯﻳﺮﺍ ﻭﺍﺭﻳﺎﻧﺲ ﺑ ﺎﻗﻴﻤﺎﻧﺪﻩﻫﺎﻱ ﺳﻄﺢ ﺳﻮﻡ، ﻣﻌﻨﻲ  ﺩﺍﺭ  ﺷﺪ

 ﮐﻪ ﻧﺸﺎﻥﺩﻫﻨﺪﻩ  ﻱ ﻫﻤﺒﺴﺘﮕ  ﻲ ﻣﻌﻨ  ﻲ  ﺩﺍﺭ ﮔﻮﺍﺗﺮ  ﺩﺭ ﺍﻓﺮﺍﺩ  ﻫﺮ ﺍﺳﺘﺎﻥ

ﺍﺳﺖ. ﻳﺎﻓﺘﻪ  ﻫﺎ ﻧﺸﺎﻥ  ﺩﺍﺩ  ﻛﻪ ﺧﻄﺎﻱ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ  ﺐﻳﺿﺮﺍ ﻣﺘﻐﻴﺮﻫﺎ

 ﺩﺭ ﻣﺪﻝ  ﺳﻪﺳﻄﺤﻲ ﻧﺴﺒﺖ  ﺑﻪ ﺩﻭﺳﻄﺤﻲ  ﻭ  ﺩﺭ ﻣﺪﻝ ﺩﻭﺳﻄﺤﻲ

ﻧﺴﺒﺖ  ﺑﻪ  ﺗﻚﺳﻄﺤﻲ ﺑﻴﺸﺘﺮ ﺑﺮﺁﻭﺭﺩ ﺷﺪﻩ ﺍﺳﺖ  ﺑﻪ. ﻋﺒﺎﺭﺕ ﺩﻳﮕﺮ

ﺩﺭ  ﻣﺪﻝﻫﺎﻱ ﺗ  ﻚﺳﻄﺤﻲ  ، ﺧﻄﺎﻱ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺿﺮﺍﻳﺐ ﺩﭼﺎﺭ

 ﻛﻢﺑﺮﺁﻭﺭﺩﻱ ﺍﺳﺖ. ﺍﻳﻦ ﺍﻣﺮ ﺑﺎﻋﺚ  ﻣﻲﺷﻮﺩ  ﻛﻪ ﮔﺎﻫﻲ ﻣﺘﻐﻴﺮﻫﺎﻳﻲ

 ﻛﻪ ﺩﺭ  ﻣﺪﻝﻫﺎﻱ ﺩﻭﺳﻄﺤﻲ ﻣﻌﻨﻲﺩﺍﺭ ﻧﻴﺴﺘﻨﺪ  ، ﺩﺭ  ﻣﺪﻝﻫﺎﻱ

 ﺗﻚﺳﻄﺤﻲ  ﺑﻪ ﺍﺷﺘﺒﺎﻩ ﻣﻌﻨﻲﺩﺍﺭ ﺷﻮﻧﺪ  ﻳﺎ ﻭ ﻣﺘﻐﻴﺮﻫﺎﻳﻲ  ﻛﻪ  ﺩﺭ

 ﻣﺪﻝﻫﺎﻱ  ﺳﻪﺳﻄﺤﻲ ﻣﻌﻨﻲ  ﺩﺍﺭ ﻧﻴﺴﺘﻨﺪ  ،  ﺩﺭ  ﻣﺪﻝﻫﺎﻱ ﺩﻭﺳﻄﺤﻲ

 ﺑﻪ ﺍﺷﺘﺒﺎﻩ ﻣﻌﻨﻲﺩﺍﺭ ﺷﻮﻧﺪ.

۷

ﺍﻳﻦ ﻣﻮﺿﻮﻉ  ﺩﺭ ﻣﻮﺭﺩ ﻣﺘﻐﻴﺮﻫﺎﻱ

ﻣﺮﺗﺒﻂ  ﺑﺎ ﮔﻮﺍﺗﺮ  ﻧﻴﺰ  ﺩﺭ ﺍﻳﻦ ﻣﻄﺎﻟﻌﻪ ﺻﺪﻕ  ﻣﻲ   .ﻛﻨﺪ

 ﺑﺎ ﻣﻘﺎﻳﺴﻪﻱ ﺧ ﻱﻄﺎ  ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺑﺮﺁﻭﺭﺩ ﻣﺘﻐﻴﺮﻫﺎﻱ ﻣﺪﻝ

 ﺳﻪﺳﻄﺤﻲ ﻭ ﺩﻭﺳﻄﺤﻲ ﻣﺸﺎﻫﺪﻩ  ﻣﻲﻛﻨﻴﻢ ﻛﻪ ﺩﺭ ﻣﺪﻝ

ﺩﻭﺳﻄﺤﻲ،  ﺧﻄﺎﻱ  ﺍﺳﺘﺎﻧﺪﺍﺭﺩ ﺐﻳﺿﺮﺍ ﺩﺍﺭﺍﻱ ﻣﻘﺪﺍﺭ ﻛﻤﺘﺮﻱ

ﻧﺴﺒﺖ  ﺑﻪ ﻣﺪﻝ  ﺳﻪﺳﻄﺤﻲ ﺍﺳﺖ  .  ﺩﺭ ﻣﻄﺎﻟﻌﻪ ﻱﺍ   ﮐﻪ ﻣﺎﺭﻳﻨﻮ  ﺩﺭ

ﺳﺎﻝ ۲۰۰۶ ﺍﻧﺠﺎﻡ ﺩﺍﺩ،  ﺑﻪ ﺑﺮﺭﺳﻲ ﻋﻮﺍﻣﻞ ﺗﺄﺛﻴﺮﮔﺬﺍﺭ  ﺑﺮ ﮔﻮﺍﺗﺮ

ﻛﻮﺩﻛﺎﻥ ﭘﺮﺩﺍﺧﺖ ﻴﻧﺘ ﻦﻳﺍ ﺑﻪ ﻭ  ﺠﻪ  ﺪﻴﺭﺳ  ﮐﻪ ﺧﻄﺮ ﺍﺑﺘﻼ  ﺑﻪ ﮔﻮﺍﺗﺮ

 ﺩﺭ ﻣﻨﺎﻃﻖ ﺳﺎﺣﻠ  ﻲ ﮐﻤﺘﺮ  ﺍﺯ ﻣﻨﺎﻃﻖ  ﺮﻴﻏ ﺳﺎﺣﻠ  ﻲ ﺍﺳﺖ.

۳

 ﻦﻳﺍ ﺩﺭ

ﻣﻄﺎﻟﻌﻪ  ﺰﻴﻧ ﺳﺎﺣﻠ  ﻲ ﺑﻮﺩﻥ ﺍﺳﺘﺎﻥ ﻣﺤﻞ ﺳﮑﻮﻧﺖ  ﺑﻪ ﻋﻨﻮﺍﻥ ﮑﻳ  ﻲ

 ﺍﺯ ﻋﻮﺍﻣﻞ ﺗﺄﺛﻴﺮﮔﺬﺍﺭ  ﺩﺭ ﮔﻮﺍﺗﺮ ﮐﻮﺩﮐﺎﻥ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻪ  ﺑﺮ ﻭ ﺷﺪ

ﺧﻼﻑ ﻣﻄﺎﻟﻌ  ﻪﻫﺎﻱ ﻗﺒﻠ ﻴﻧﺘ ﻦﻳﺍ ﺑﻪ ﻲ  ﺠﻪ  ﻢﻳﺪﻴﺭﺳ  ﮐﻪ ﺧﻄﺮ ﺍﺑﺘﻼ  ﺑﻪ 

ﮔﻮﺍﺗﺮ  ﺩﺭ ﺍﺳﺘﺎﻥ  ﻱﻫﺎ ﺳﺎﺣﻠ ﻴﺑ ﻲ ﺸﺘﺮ  ﺍﺯ ﺍﺳﺘﺎﻥ  ﺮﻴﻏ ﻱﻫﺎ ﺳﺎﺣﻠ  ﻲ

ﺍﺳﺖ.  ﻫﻢﭼﻨﻴﻦ  ، ﺩﻻﻧﮋ  ﺭﺩ ﺳﺎﻝ ۲۰۰۶  ﺑﻪ ﺑﺮﺭﺳﻲ ﺍﺛﺮ ﺍﺭﺗﻔﺎﻉ  ﺍﺯ 

ﺳﻄﺢ ﺩﺭﻳﺎ  ﺑﺮ ﺑﻴﻤﺎﺭﻱ ﮔﻮﺍﺗﺮ  ﺩﺭ ﺍﻳﺎﻟﺖ ﺍﻭﻫﺎﻳﻮ ﺁﻣﺮﻳﻜﺎ ﭘﺮﺩﺍﺧﺖ

ﻳ ﺑﻪ ﻭ ﺎﻓﺘﻪﻫﺎﻱ ﻣﺸﺎﺑﻪ  ﻦﻳﺍ ﻣﻄﺎﻟﻌﻪ ﺩﺳﺖ ﻳﺎﻓﺖ.

۹

   

ﻫﻤﺎﻥ ﻃﻮﺭ  ﮐﻪ ﻳﺎﻓﺘﻪﻫﺎﻱ ﺍﻳﻦ ﻣﻄﺎﻟﻌﻪ ﻧﺸﺎﻥ ﺩﺍﺩ، ﻣﺪﻝ

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ ﭼﻨﺪﺳﻄﺤﻲ ﻣﺪﻝ ﻣﻨﺎﺳﺐﺗﺮ ﻱ ﻧﺴﺒﺖ  ﺑﻪ 

ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ  ﺗﮏﺳﻄﺤﻲ ﺍﺳﺖ  ، ﭼﺮﺍ ﮐﻪ ﺳﺎﺧﺘﺎﺭ

ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒﻲ  ﺭﺍ  ﺩﺭ  ﻫﺎ ﺩﺍﺩﻩ  ﺩﺭ ﻧﻈﺮ ﻣ ﻴﮔ ﻲ ﺮﺩ.  ﺩﺭ ﻣﻄﺎﻟﻌﻪ  ﻱ 

ﻣﺸﺎﺑﻬ  ﻲ  ﮐﻪ ﺍﺳﮑﺮﺍﻧﺎﻝ  ﻭ ﻫﺴﮑﺚ  ﺩﺭ ﺳﺎﻝ ۲۰۰۲ ﺍﻧﺠﺎﻡ ﺩﺍﺩﻧﺪ  ﺑﻪ 

ﺑﺮﺭﺳﻲ ﺭﮔﺮﺳﻴﻮﻥ ﻟﺠﺴﺘﻴﮏ ﭼﻨﺪﺳﻄﺤﻲ  ﺑﺎ  ﺩﺭ ﻧﻈﺮ ﮔﺮﻓﺘﻦ

ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒ  ﻲ  ﻫﺎ ﺩﺍﺩﻩ ﭘﺮﺩﺍﺧﺘﻨﺪ  ﺑﻪ ﻭ ﺍﻳﻦ ﻴﻧﺘ  ﺠﻪ ﻣﺸﺎﺑﻪ

ﻴﺭﺳ  ﺪﻧﺪ  ﮐﻪ  ﺩﺭ ﻧﻈﺮ ﻧﮕﺮﻓﺘﻦ ﺳﺎﺧﺘﺎﺭ ﺳﻠﺴﻠﻪﻣﺮﺍﺗﺒ  ﻲ  ﺩﺭ  ﻱﻫﺎ ﻣﺪﻝ

ﭼﻨﺪﺳﻄﺤﻲ ﻣﻨﺠﺮ  ﺑﻪ ﻛﻤﺘﺮ ﺑﺮﺁﻭﺭﺩ ﻛﺮﺩﻥ ﺧﻄﺎﻱ ﺍﺳﺘﺎﻧﺪﺍﺭﺩ

ﺐﻳﺿﺮﺍ ﺭﮔﺮﺳﻴ ﻲﻮﻧ  ﻣﻲﺷﻮﺩ.

۱۰

ﺭﺩ ﻦﻳﺍ ﻣﻄﺎﻟﻌﻪ  ﺑﺎ ﮐﻤﮏ

 ﻣﺪﻝﺑﻨﺪﻱ ﭼﻨﺪﺳﻄﺤ  ﺭﺩ ﻲ ﻱﻫﺎ ﺩﺍﺩﻩ ﮔﻮﺍﺗﺮ ﮐﻮﺩﮐﺎﻥ،  ﺑﻪ ﺑﺮﺍﺯﺵ

ﺭﮔﺮﺳﻴ  ﻮﻥ ﻟﺠﺴﺘﻴﮏ ﭼﻨﺪﺳﻄﺤ  ﻲ ﭘﺮﺩﺍﺧﺘ  ﻭ ﻢﻴ ﻋﻮﺍﻣﻞ ﻣﺮﺗﺒﻂ  ﺑﺎ 

ﮔﻮﺍﺗﺮ ﮐﻮﺩﮐﺎﻥ ﺷﻨﺎﺳﺎ  ﻳﻲ ﺷﺪﻧﺪ.  

 ﺩﺭ ﻣﺠﻤﻮﻉ، ﻳﻣﻘﺎ ﻱ ﺴﻪ ﻱﻫﺎ ﻣﺪﻝ ﻣﻮﺭﺩ ﺍﺳﺘﻔﺎﺩﻩ ﻧﺸﺎﻥ  ﺩﺍﺩ

 ﮐﻪ ﺍﺳﺘﻔﺎﺩﻩ ﺍﺯ ﻱﻫﺎ ﻣﺪﻝ ﺭﮔﺮﺳﻴ ﻲﻮﻧ ﻣﻌﻤﻮﻟﻲ ﺩﺭ  ﻱﻫﺎ ﺩﺍﺩﻩ

ﺳﻠﺴﻠﻪ  ﻣﺮﺍﺗﺒﻲ ﻣ  ﻲﺗﻮﺍﻧﺪ  ﺑﻪ ﺧﻄﺎﻱ ﺑﺮﺁﻭﺭﺩ ﭘﺎﺭﺍﻣﺘﺮﻫﺎﻱ ﻣﺪﻝ

ﻣﻨﺠﺮ ﺷﻮﺩ  ﻭ ﺑﺎﻋﺚ ﻴﻧﺘ ﺮﻴﮔ ﺠﻪ  ﻱ ﻧﺎﺩﺭﺳﺖ  ﺍﺯ  ﻫﺎ ﺩﺍﺩﻩ ﺷﻮﺩ   .

ﺳﭙﺎﺳﮕﺰﺍﺭﻱ:  ﺍﺯ ﭘﮋﻭﻫﺸﮑﺪﻩﻱ ﻋﻠﻮﻡ ﻏﺪﺩ ﺩﺭﻭﻥ  ﻭ ﺰﻳﺭ ﻣﺘﺎﺑﻮﻟﻴ  ﺴﻢ

ﺩﺍﻧﺸﮕﺎﻩ ﻋﻠﻮﻡ ﭘﺰﺷﮑﻲ ﻭ ﺧﺪﻣﺎﺕ ﺑﻬﺪﺍﺷﺘﻲ-ﺩﺭﻣﺎﻧﻲ  ﺪﻴﺷﻬ ﺑﻬﺸﺘ  ﻲ  ﮐﻪ

ﻱﻫﺎ ﺩﺍﺩﻩ ﻦﻳﺍ ﻣﻄﺎﻟﻌﻪ  ﺭﺍ  ﺩﺭ ﺍﺧﺘﻴﺎﺭ  ﭘﮋﻭﻫﺸﮕﺮﺍﻥ ﻗﺮﺍﺭ ﺩ ﺍﺩ  ﺍﺯ ﻭ ﻧﺪ

ﻱ ﻫﻤﻪ ﺍﻓﺮﺍﺩﻱ  ﮐﻪ ﺩﺭ  ﺟﻤﻊﺁﻭﺭﻱ  ﻫﺎ ﺩﺍﺩﻩ ﺩﺭ ﺍﺳﺘﺎﻥ ﻱﻫﺎ ﮐﺸﻮﺭ

ﻫﻤﮑﺎﺭﻱ ﻧﻤﻮﺩ  ،ﻧﺪ ﺳﭙﺎﺳﮕﺰﺍﺭﻱ  ﻣﻲﺷﻮﺩ.  ﻫﻢ  ﺍﺯ ،ﻦﻴﭼﻨ ﺟﻨﺎﺏ ﺁﻗﺎﻱ

ﻣﻴﺮﺳﻌﻴﺪ ﻳﻜﺎﻧﻲﻧﮋﺍﺩ ﻪ ﺑ ﺩﻟﻴﻞ ﮐﻤﮏﻫﺎﻱ  ﺑﻲﺩﺭﻳﻐﺸﺎﻥ ﺗﺸﮑﺮ  ﻭ ﻗﺪﺭﺩﺍﻧﻲ

 ﻣﻲﺷﻮﺩ. ﺍﻳﻦ ﻣﻘﺎﻟﻪ ﺑﺮ ﮔﺮﻓﺘﻪ ﺍﺯ ﭘﺎﻳﺎﻥﻧﺎﻣﻪﻱ ﮐﺎﺭﺷﻨﺎﺳﻲ ﺍﺭﺷﺪ

ﺭﺷﺘﻪ  ﻱ ﺁﻣﺎﺭ ﺯﻳﺴﺘﻲ ﺍ .ﺳﺖ   ۳۶۴ ﻣﺠﻠﻪ  ﻱ ﻏﺪﺩ ﺩﺭﻭﻥ  ﻭ ﺭﻳﺰ ﻣﺘﺎﺑﻮﻟﻴﺴﻢ ﺍﻳﺮﺍﻥ ﺩﻭﺭﻩﻱ ﺩﻭﺍﺯﺩﻫﻢ, ﺷﻤﺎﺭﻩ ، ۴ ﻱ ﺁﺑﺎﻥ ۱۳۸۹

  

References 

1. Delange F. Iodine deficiency as a cause of brain 

damage. Postgrad Med J 2001; 77: 217-20. 

2. Marino C, Martinelli M, Monacelli G, Stracci F, 

Stalteri D, Mastrandrea V, et al. Evaluation of goiter using ultrasound criteria: a survey in a middle 

schoolchildren population of a mountain area in 

Central Italy. J Endocrinol Invest 2006; 29: 869-

75. 

3. Goldstein H, Browne W, Rasbash J. Multilevel 

modeling of medical data. Stat Med 2002; 21: 

3291-315. 

4. Bardenheier BH, Shefer A, Barker L, Winston 

CA, Sionean CK. Public health application comparing multilevel analysis with logistic regression: 

immunization coverage among long-term care 

facility residents. Ann Epidemiol 2005; 15: 749-

55. 

5. Agresti A. Categorical data analysis.New York: 

2007. p 99-137. 

6. Azizi F, Delshad H, Mehrabi Y. Thyroid volumes 

in school children of Tehran: comparison with 

European school chidren. J Endocrinol Invest 

2001; 24: 756-62. 

7. Goldestien H, Leeuw J, Meijer E. Handbook of 

multilevel analysis 2008; 15: p 692-9. 

8. Sooch S, Deo M. Prevention of endemic goiter 

with iodized salt. 2007; 49: 307-12. 

9. Delange F. American thyromobil study group. 

Journal of Endocrine 2006; 47: 162.  

10. Skronal D, Hesketh S, Multilevel Logistic Regression. Statistic in medicine.  2002; 3: 411-20. 449/Iranian Journal of Endocrinology and Metabolism Vol 12 No.4 November 2010

Original Article 

Comparison of Oridinary and Multilevel Logistic Regression 

in Determining Goiter Related Factors in Children  

1Cheraghi R, 

2Mehrabi Y, 

3Eshraghian M, 

4Delshad H, 

5Alavi majd H 

1

International Branch of Shahid Beheshti University of Medical Sciences, 

2Public Health Faculty, Shahid Beheshti 

University of Medical Sciences, 

3Public Health Faculty, Tehran University of Medcial Sciences, 

4Endocrine Research 

Center, Research Inistitute for Endocrine Sciences, Shahid Beheshti University of Medical Sciences, 

5Para Medical 

Faculty, Shahid Beheshti University of Medical Sciences, Tehran, I.R.Iran 

e-mail: ymehrabi@gmail.com  

Received: 02/01/2010  Accepted: 22/06/2010

  

Abstract 

Introduction: The aim of this research was comparison of multilevel and ordinary logistic 

regression in determining goiter related factors in children, based on hierarchical structure of the 

data.  Materials and Methods: Data of 35747 schoolchildren, aged 8-10 years, was collected in 2007 

by the Research Institute of Endocrine Sciences, Shahid Beheshti University of Medical Sciences.  

Stratified and cluster random sampling methods were employed in 30 provinces across the 

country. Goiter status, sex, area of residence, altitude from sea level and status of Iodized salt 

storage in households were documented. Multilevel logistic regression model was applied and  the 

results compared to those obtained using ordinary logistic regression. Results: The study showed 

that 5.74% of the pupils suffered from goiter. The variance of the 2nd level (districts) was estimated

as 0.941 (SE=0.092) in the two-level model (p<0.001), in which no significant relation was seen 

between goiter and altitude from sea level (OR=1.27; 95%CI: 0.78, 1.62). In the three-level model, 

the variance in the third level (provinces) was 1.031 (SE=0.287) (p<0.001). In the final three-level 

model, only sex and area of residence were found to be significant. Conclusion: Results showed 

that, compared to two and three level logistic regression models, the variances of parameter 

estimates are underestimated in the ordinary logistic regression. 

Keywords: Multilevel Model, Logistic Regression, Hierarchical structure, Goiter 

امروزه در بيشتر پژوهش‌ها در پي رسيدن به هدفي خاص با استفاده از چندين عامل ديگر هستيم بنحوي كه ه مقدار بهينه را بدهد. كه در آمار با روش‌هاي مختلف رگرسيوني به انجام اين چنين كارهايي پرداخته و نتايج تحليل مي‌شود.


در رگرسيون به‌وسيله متغيرهاي مستقل، متغير پاسخ  برآورد مي‌شود. كه اين متغير پاسخ همان هدف اصلي در پژوهش‌ها مي‌باشد.


همانطور كه گفته شد روش‌هاي مختلف رگرسيوني با توجه به نوع عامل‌ها در تحقيقات استفاده مي‌شود. رگرسيون لجستيك نيز حالت خاصي از رگرسيون است كه در مواردي كه متغير پاسخ دو گزينه‌اي يا چند گزينه‌اي است؛ يعني فقط دو يا چند حالت متفاوت براي متغير پاسخ وجود دارد، به‌كار مي‌رود.


اين حالت بيشتر در تحقيقات پزشكي و جامعه شناسي مورد استفاده قرار مي‌گيرد. مثل عامل‌هايي كه در بيماري‌هاي سرطاني موثرند. يا در اين تحقيق مانند مرده يا زنده بودن راننده، وضعيت خودرو پس از تصادف، وضعيت جسمي راننده و ...


هرگاه بخواهيم رابطه‌اي ميان مجموعه‌اي از Xها را با يك متغير وابسته مانند Y مشخص كنيم با يك مسأله چند متغيره روبرو هستيم.


 در تحليل چنين مسائلي از چندين روش رياضي استفاده مي‌شود.


رگرسيون لجستيك يك مدل رياضي است كه مي‌تواند براي توصيف رابطه چندين متغير X با يك متغير وابسته دو حالتي يا چند حالتي(متغيري كه فقط داراي دو يا چند وضعيت متفاوت است) به عنوان  Yمورد استفاده قرار گيرد.


منظور از متغير دو حالتي، متغيري است كه فقط داراي دو جواب مي‌باشد، مانند مردن يا زنده ماندن، كمربند ايمني بستن يا نبستن، حاضر بودن يا غايب بودن و بيمار بودن يا بيمار نبودن. اغلب براي اين متغير‌ها از كدهاي صفر و يك استفاده مي‌شود، كد يك را براي حالت مثبت بودن (موفقيت) آن خاصيت (بيمار بودن) و كد صفر براي منفي بودن (شكست) آن به كار مي‌رود.


 تابع لجستيك:  


شكل و فرمول تايع لجستيك را در زير مشاهده مي كنيد:


       (1)                                                                                                 


با توجع به شكل و فرمول مشاهده مي‌كنيم كه برد تابع بين صفر و يك قرار دارد، كه دليل اصلي مناسب بودن رگرسيون لجستيك براي متغير پاسخ دو حالتي همين قرار گرفتن برد در فاصله صفر و يك است. مدل طراحي شده احتمال را كه هميشه بين صفر و يك قرار دارد توصيف مي‌كند.


 دليل ديگر براي انتخاب رگرسيون لجستيك شكل نمودار مي‌باشد كه با افزايش Z از  به ، تابع از صفر به سمت يك به طور پيوسته و صعودي افزايش مي‌يابد.


مدل لجستيك:


مدل لجستيك را با توجه به تابع لجستيك بدست مي‌آوريم.


Z را به‌ صورت مجموع خطي بعلاوه  ضربدر ها مي‌نويسيم (در اصل، Z فهرستي از تركيبات هاست):



كه و ها( ) پارامترهاي مجهول مي‌باشند.


حال با جايگزين كردن اين مجموع خطي در تابع لجستيك داريم:      


(2)                                                                       


كه گاهي آن‌ را به‌ صورت زير نيز مي‌نويسند:


(3)      


همانطور كه گفته شد متغير پاسخ در مدل لجستيك دو حالتي است، اگر خاصيت مورد نظر يعني موفقيت را بخواهيم آنگاه احتمالش برابر است با:


                                            


پس مدل لجستيك برابر است با:


(4)                                                       


براي راحتي كار را به اختصار با  نشان مي‌دهيم.


 (۵)                 

منبع: http://pakgohar.blogfa.com/post/135/%D8%A2%D9%85%D9%88%D8%B2%D8%B4-%D8%B1%DA%AF%D8%B1%D8%B3%D9%8A%D9%88%D9%86-%D9%84%D8%AC%D8%B3%D8%AA%D9%8A%DA%A9                  

سئوالات نظریه سئوال- پاسخ تیرماه 91 ورودی دکتری سنجش 89

بسم الله الرحمن الرحيم

سئوالات نظریه سئوال- پاسخ تیرماه 91 ورودی دکتری سنجش 89 

1-نامتغیر بودن پارامترهای سوال و توانایی در نظریه سئوال – پاسخ چگونه اثبات می شود؟ 

2- شباهت و تفاوت انواع روش های همتراز سازی در چیست؟ از  در فرایند همترازسازی نمرات آزمون ها وجود چه شرایطی لازم است و چه عواملی را باید در نظر گرفت؟

3- ماتریس زیر حاوی پاسخ های 5 نفر به 5 سوال چهار گزینه ای می باشد. با استفاده از روش JMLپارامترهای سوال و توانایی را برآورد کرده و در مورد برازش داده ها با مدل یک پارامتری اظهار نظر کنید.


سوالات

افراد

5 4 3 2 1

1 1 0 1 1 1

0 0 1 0 1 2

1 1 1 1 0 3

1 1 0 1 0 4

0 0 1 0 0 5


4- در آزمونی 3 سئوالی که مقدارα به ترتیب برابر با 5/.، 1 و 5/1 می باشد و مقدار دشواری برابر با 5/.، 0 و 5/.- است فردی به هر سه سئوال پاسخ صحیح داده است با فرض نرمال بودن توزیع پیشینθ توانایی فرد را تعیین کنید. 

5- رابطه آگاهی سئوال و سنجش انطباقی را شرح دهید.

 با تشكر از سركار خانم مقدسين(دانشجوي دكتري دانشگاه علامه طباطبايي)


ضريب آلفاي کرونباخ؛ مفاهيم، کارکرد و شيوه هاي نوين آن

ضريب آلفاي کرونباخ؛ مفاهيم، کارکرد و شيوه هاي نوين آن  

دکترامير تيمور پاينده1، دکتر مريم اميدي نجف آبادی2، فهيمه مسعودي فر3

1و 3: دانشگاه شهيد بهشتي، دانشکده علوم رياضي، گروه آمار

2: دانشگاه آزاد اسلامي واحد علوم وتحقيقات، گروه ترويج و آموزش کشاوزي

amirtpayandeh@sbu.ac.ir 

چکيده :

بي شک همه ي ما درطول دوران زندگي خود حداقل يکبار پرسشنامه پرکرده ايم. تا بحال ازخود پرسيده ايد که اين پرسشنامه ها چگونه تهيه مي شوند و نيز معياري براي بررسي ميزان قابليت اطمينان آنها وجود دارد يا خير؟ بديهي است که چنين مقياسي وجود دارد، چرا که بسياري از بررسي ها ي آماري درسطوح وسيع ابتدا درقالب پرسش نامه پايه گذاري مي شوند، پس مي بايست ملاکي براي نظارت  بر قابليت  اعتماد  آنها  وجود داشته باشد.

در اين مقاله، ابتدا به مفهوم ضريب آلفاي کرونباخ و کارکرد آن، شيوه محاسبه آن با استفاده از نرم افزارهاي آماري مي پردازد. نهايتا به معرفي تتاي ترتيبي  و ارائه برنامه ای جهت محاسبه آن (با استفاده از نرم افزار R)خواهيم پرداخت.

مفهوم ضريب آلفاي کرونباخ:

ضريب آلفاي کرونباخ توسط کرونباخ ابداع شده و يکي ازمتداولترين روشهاي اندازه گيري اعتماد پذيري و يا پايائي پرسش نامه هاست. منظور از اعتبار يا پايايي پرسش نامه اين است که اگر صفت هاي مورد سنجش با همان وسيله و تحت شرايط مشابه و در زمانهاي مختلف مجددا اندازه گيري شوند، نتايج تقريبا يکسان حاصله شود.

 ضريب آلفاي کرونباخ، براي سنجش ميزان تک بعدي بودن نگرشها، عقايد و ... بکار مي رود. در واقع مي خواهيم ببينيم تا چه حد برداشت پاسخگويان از سوالات يکسان بوده است. اساس اين ضريب بر پايه مقياسهاست. مقياس عبارتند از دسته اي از اعداد که بر روي يک پيوستار به افراد، اشيا يا رفتارها در جهت به کميت کشاندن کيفيت ها اختصاص داده مي شود. رايج ترين مقياس که در تحقيقات اجتماعي بکار مي رود مقياس ليکرت است. در مقياس ليکرت اساس کار بر فرض هم وزن بودن گويه ها استوار است. بدين ترتيب به هر گويه نمراتي (مثلا از1 تا 5 براي مقياس ليکرت 5 گويه اي) داده مي شود که مجموع نمراتي که هر فرد از گويه ها مي گيرد نمايانگر گرايش او خواهد بود. 

آلفاي کرونباخ بطورکلي با استفاده از يکي روابط  زيرمحاسبه مي شود.

  يا   

که دراين روابط  k تعداد سوالات،   واريانس سوال i ام،   واريانس مجموع کلي سوالات،  ميانگين کواريانس بين سوالات، و   واريانس ميانگين سوالات مي باشند (برگرفته شده از آلن و ين، 2002). 

با استفاده از تعريف آلفاي کرونباخ مي توان نتيجه گرفت: (1) هرقدرهمبستگي مثبت بين سوالات بيشتر شود، ميزان آلفاي کرونباخ بيشتر خواهد شدو بالعکس، (2) هر قدر واريانس ميانگين سوالات بيشتر شود آلفاي کرونباخ کاهش پيدا خواهد کرد، (3) افزايش تعداد سوالات تاثيرمثبت و يا منفي (بسته به نوع همبستگي بين سوالات) بر ميزان آلفاي کرونباخ خواهد گذاشت، (4) افزايش حجم نمونه باعث کاهش واريانس ميانگين سوالات در نتيجه باعث افزايش آلفاي کرونباخ خواهد شد. 

بديهي است هرقدر شاخص آلفاي کرونباخ به 1نزديکترباشد، همبستگي دروني بين سوالات بيشتر و در نتيجه پرسشها همگن ترخواهند بود. کرونباخ ضريب پايايي %45 را کم، %75 را متوسطو قابل قبول، و ضريب %95 را زياد پيشنهاد کرده (کرونباخ، 1951). بديهي است درصورت پايين بودن مقدارآلفا، بايستي بررسي شود که با حذف کدام پرسشها مقدارآن را مي توان افزايش داد. 

تتاي ترتيبي:

در سال 1974 آمارداني به نام آمور در مورد استفاده از آلفاي کرونباخ آماردانان ديگر را به چالش کشيد. استدلال او اين بود که آلفاي کرونباخ بر علاوه بر نارايب بوده (نارايبي مثبت)، بر اساس شاخص هاي تعريف و محاسبه مي گردنند که مربوط به داده هاي با مقياس فاصله اي و يا نسبتي هستند، بنابراين استفاده از آلفاي کرونباخ براي محاسبه اي ميزان پايائي پرسش نامه هاي که حاوي سوالات ترتيبي هستند دقيق به نظر نمي رسد. او براي رفع اين مشکل شاخص جديدي تحت عنوان تتاي ترتيبي به صورت زير ارائه داد.

 

که   بيشترين مقدار ويژه در تحليل مولفه اي اصلي مي باشد. اخيرا زامبو، گادرومن، و زيسر (2007) به مطالعه اين شاخص پرداخته و با چندين مثال شبيه سازي شده نشان دادند که ضريب آلفاي کرونباخ هميشه مقدار پاياي را کم برآورد مي کند. بنابراين توصيه مي شود که در هنگامي که داده ها ترتيبي هستنند به جاي آلفاي کرونباخ از تتاي ترتيبي استفاده شود.

چگونگي محاسبه به همراه مثال عملي:

بسياري از نرم افزارهاي آماري قادر به محاسبه آلفاي کرونباخ هستند. در اين قسمت از مقاله چگونگي محاسبه ي آلفاي کرونباخ را توسط دو نرم افزار SPSS و SAS شرح داده، سپس با ارائه يک برنامه به زبان R  چگونگي محاسبه ي آلفاي کرونباخ و تتاي ترتيبي را توسط نرم افزار R نشان مي دهيم. در ادامه با استفاده از سوالات نمونه گيري مقدماتي اميدي (1387) چگونگي سنجش آلفاي کرونباخ و تتاي ترتيبي را نشان مي دهيم.

براي محاسبه آلفاي کرونباخ  به کمک نرم افزار SPSS مسير زيررا دنبال مي کنيم :

Analyze> Scale> Reliability Analysis…

چنانچه مايل باشيم بررسي کنيم که حذف هرسوال چه ميزان روي ضريب آلفاي کرونباخ تاثير مي گذارد، بعد از باز شدن پنجره “Reliability Analysis Reliability Analysis” روي گزينه Statistics کليک کرده و در قسمت “Descriptive for” گزينه “Scale if item deleted”  را انتخاب کنيم.

خروجي نرم افزارSPSS براي داده هاي اميدي (1387) به صورت زيرخواهد بود:

جدول1) خروجی نرم افزار شامل ضريب آلفا و تعداد سوالات

Reliability Statistics

Cronbach's Alpha N of Items

.855 13





جدول2) خروجی نرم افزار

Item-Total Statistics

Scale Mean if Item Deleted Scale Variance if Item Deleted Corrected Item-Total Correlation Cronbach's Alpha if Item Deleted

V1 48.159 45.067 .470 .848

V2 48.500 44.488 .517 .845

V3 47.977 46.162 .484 .847

V4 48.318 43.989 .660 .838

V5 48.045 44.230 .495 .846

V6 49.227 45.808 .147 .890

V7 47.864 44.074 .690 .837

V8 48.136 43.283 .653 .837

V9 48.000 45.442 .515 .846

V10 48.068 43.646 .616 .839

V11 47.841 43.532 .680 .836

V12 48.318 43.106 .597 .840

V13 48.545 41.323 .671 .834


همانطوريکه ملاحظه مي شود مقدارآلفاي محاسبه شده برابر85 درصد است، که مقدار قابل قبولي است. همانطور که جدول شماره 2 نشان مي دهد حذف سوال ششم (v6) باعث افزايش آلفاي کرونباخ به 89 درصد خواهد شد.   

آلفاي کرونباخ در نرم افزار SAS با استفاده از دستور 

proc corr alpha nocorr nomiss; Variables; run;

محاسبه مي گردد. که به دلايل مشابه بودن خروجي با نرم افزار SPSS از ذکر جزئيات آن خوداري مي کنيم. 

دو نرم افزار SPSS  و SAS قادر به محاسبه ي تتاي ترتيبي نمي باشند و نرم افزار S-plus و R توانائي محاسبه آلفاي کرونباخ را ندارند.

در ادامه با ارائه تابعي (پيوست الف) چگونگي محاسبه آلفاي کرونباخ و تتاي ترتتيبي را توسط R  نشان مي دهيم. 

خروجي برنامه بالا تحت نرم افزار R  براي داده هاي اميدي (1387) در جدول 3 خلاصه شده است.

جدول 3) خروجی برنامه پيوست الف

New_Theta $` Ordinal Theta if a Question Deleted` New_Alpha $`Alpha if a Question Deleted`

0.8849911 Without Question 1 0.8476305 Without Question 1

0.8840719 Without Question 2 0.8448156 Without Question 2

0.8867511 Without Question 3 0.8474065 Without Question 3

0.8765560 Without Question 4 0.8377251 Without Question 4

0.8854676 Without Question 5 0.8461963 Without Question 5

0.8949432 Without Question 6 0.8899667 Without Question 6

0.8737700 Without Question 7 0.8368503 Without Question 7

0.8754874 Without Question 8 0.8368983 Without Question 8

0.8834650 Without Question 9 0.8455129 Without Question 9

0.8782972 Without Question 10 0.8390775 Without Question 10

0.8741109 Without Question 11 0.8361389 Without Question 11

0.8814010 Without Question 12 0.8395971 Without Question 12

0.8775920 Without Question 13 0.8338930 Without Question 13

$`Ordinal Theta for all Question=`  0.8895967 $`Cronbach's Alpha for all Question=` 0.8551825


نتيجه آلفاي کرونباخ جدول بالا مشابه با نرم افزار SPSS مي باشد. همچنين تتاي ترتيبي نيز نتيجه مشابه با آلفاي کرونباخ ارائه مي دهد با اين تفاوت که تتاي ترتيبي برآوردگر دقيق تر نسبت به آلفاي کرونباخ براي پايائي سوالات ارائه مي کند.

نتيجه گيري:

با توجه به کم برآورد پايائي توسط آلفاي کرونباخ توصيه مي شود پايائي سوالات ترتيبي با استفاده از تتاي ترتيبي سنجيده شود.


منابع :

1- Armor, D. J. (1974). Theta reliability and factor scaling. Sociological methodology, 17-50.

2- Cronbach, L. J. (1951). Coefficient alpha and the internal structure of tests. Psychometrika. 16, 297-334.

3- Diener, E , Emmons, R. A., Larsen, R. J., & Griffin, S. (1985). The satisfaction with life scale. Journal of Personality Assessment, 49, 71-75 .

4- Lord, F. M. & Novick, M. R. (1968). Statistical theories of mental test scores. Reading MA: Addison-Wesley Publishing Company.

5- Zumbo, D. B., Gadermann, A. M., and Zeisser, C. (2007). Ordinal versions of coefficient alpha and theta for Likert rating scales. Journal of modern applied statistical methods, 6, 21-29.

6- اميدي، م. (1387). طراحی نظام فناوری اطلاعات و ارتباطات به منظور آموزش کارگزاران خصوصی بيمه کشاورزی ايران. رساله دکتری واحد علوم و تحقيقات دانشگاه آزاد اسلامی. 

  

پيوست الف  (برنامه محاسباتي آلفاي کرونباخ و تتاي ترتيبي توسط نرم افزار R)

Alpha<-function(all_data){

N<-ncol(all_data)

  D<-c()  

Q<-c()

# Cronbach’s alpha calculation

Alpha_Cronbach<-function(data){

k<-ncol(data)  

s<-cov(data)  

A<-c()

sumcov<-sum(s) 

for(i in 1:k){

A<-c(A,s[i,i]) }

sumcov<-sumcov-sum(A)

alpha<-1/((k-1)*mean(A)/sumcov+(1-1/k))

return(alpha) }

 # Ordinal’s theta calculation

theta_ordinal<-function(data){

p<-ncol(data)

p/(p-1)*(1-1/max(eigen(cor(data))$value)) }

for (j in 1: N){

D<-c(D,Alpha_Cronbach(all_data[-j]))

Q<-c(Q,theta_ordinal(all_data[-j])) }

D<-c(D)

list("Alpha if a Question Deleted" = data.frame("New "=""," Alpha"=D, row.names=paste("Without Question.",1:N))

,"Cronbach's Alpha for all Question="=Alpha_Cronbach(all_data),

"Ordinal Theta if a Question Deleted"=data.frame("New "="","Theta"=Q, row.names=paste("Without Question.",1:N))

,"Ordinal Theta for all Question="=theta_ordinal(all_data)) }


ضریب آلفا و روشهاي برگرفته از مدل معادلات  à ساختاري د ر برآورد اعتبار

ضریب آلفا و روشهاي برگرفته از مدل معادلات

à ساختاري د ر برآورد اعتبار

A Comparison between Alpha Coefficient and Structural Equation

Modeling Methods to Estimation of Reliabilityà

àà مسعود کبیري

Masoud Kabiri,*

چکیده

هدف این مطالعه، مقایسه بین ضریب آلفا و

روشهاي برگرفته از مدل معادلات ساختاري در

برآورد اعتبار آزمون است. انطباق با مدل اندازه گیري

اساساً معادل-تاو و عدم همبستگی بین خطاهاي

اندازهگیري مهمترین پی شفرض هاي ضریب آلفا

است. در مقابل، روشهاي برگرفته از مدل معادلات

ساختاري علاوه بر عدم الزام در رعایت چنین

پیشفرضهایی امکان بررسی و آزمون هریک از

آنها و قابلیت وزنبندي گویهها جهت تشکیل

ترکیب بهینه براي تشکیل مقیاس را نیز بهدست

میدهد. در این مقاله چهار روش برآورد اعتبار در

روشهاي مجذور » مدل معادلات ساختاري، شامل

استفاده از ،« اعتبار مرکب » ،« همبستگی چندگانه

مورد بحث « اعتبار بیشینهاي » و « متغیرهاي خیالی »

قرار گرفت. هر یک از این روش ها بر روي داده هاي

حاصل از مقیاس ادراك نسبت به نگرش معلم

ریاضی از مجموعه مقیاسهاي نگرش نسبت به

ریاضی فنما و شرمن بهکار برده شد. دادههاي این

مقیاس از نمونه 340 نفري دانشآموزان سال اول

متوسطه بهدست آمد. نتایج کاربرد هر یک از این

روشهاي برگرفته از مدل معادلات ساختاري نشان

دادکه روشهاي معرفی شده مقادیر بالاتري از اعتبار

مقیاس نسبت به ضریب آلفا را نشان میدهند. کاهش

ضریب آلفا ممکن است به علت عدم انطباق مقیاس

با مدل اساساً معادل-تاو باشد. به طو ر کلی بحث

پیشینهاي بههمراه نتایج مطالعه نشان داد که رو ش

هاي برگرفته از مدل معادلات ساختاري برآوردهاي

دقیقتري براي اندازهگیري اعتبار آزمون هستند.

Abstract

The purpose of this study is comparison

between alpha coefficient and given methods of

structural equation modeling to estimate

reliability of a scale. Due to necessity of

restricted assumptions, that is, fitting to

essentially τ-equivalence measurement model

and uncorrelated measurement errors. Alpha

coefficient may be an inaccurate estimator, In

contrast, methods of structural equation

modeling does not require considering this

assumptions, also there are some possibilities to

test assumptions and weighting items to

construct an optimal scale. In this article, we

discuss four estimators of reliability in structural

equation modeling: square multiple coefficient,

composite reliability, phantom variable and

maximal reliability. Each of them was analyzed

on perception of math teacher' attitude scale- a

scale of Modified Fennema and Sherman's

mathematics attitude scales. Data gathered from

340 ninth grad students. The results reveal these

methods have higher values of reliability scale

rather than alpha. The reduction of alpha may be

due to miss-fit of scale to essentially τ-

equivalent model. In general, the results of this

study along with literature review show that

given methods of structural equation modeling

are more accurate estimators to measurement of

reliability.

Keywords: alpha coefficient, reliability,

structural equation modeling,estimate reliability,

square multiple coefficient, composite phantom

variable, maximal reliability, phantom variable,

maximal reliability.

کلیدواژهها: مدل معادلات ساختاري، ضریب

آلفا، اعتبار مرکب، اعتبار بیشینهاي، متغیر خیالی،

مجذور همبستگی چندگان

1388/6/ 1387 تصویب نهایی : 1 /3/ دریافت مقاله : 4 à

پژوهشگاه مطالعات وزارت آموزش و پرورش àà

à Rresearch Institute for Education of Education ministry, I,R.Iran

*Eٍmail: mkabiri@rie, ir, Tel: (+98)21 88 95 2003, 09102123787

40 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 40

مقدمه —

به عنوان رابطه واریانس واقعی به واریانس « اعتبار » ، در نظریۀ کلاسیک آزمون

مشاهده شده (رایکوف، 2004 ) و ضریب اعتبار به عنوان سهم واریانس نمره مشاهده

شدهاي که توسط واریانس نمره واقعی تبیین می شو د (گراهام، 2006 ) درنظر گرفته

میشود. بر این اساس ضریب اعتبار به عنوان شاخص کلی دقت اندازه گیر ي ملاحظه

می شود (رایکوف، 2004 ) که در نقطۀ مقابل خطاي اندازه گیر ي است . علاو ه براین،

را به عنوان تجانس نمرات یا ثبات درونی نیز تعریف نمود (آناستازي، « اعتبار » می توان

1379 ). این تعریف که یکی از رایج ترین مبانی محاسبات اعتبار را تشکیل میدهد، بر

روش ب هدست آوردن اعتبار بر اساس یکبار اجراي آزمون استوار است که در مقابل

سایر روشهاي محاسبۀ اعتبار مثل بازآزمایی و فرمهاي همتا قرار دارد. معرو فترین

روش محاسبه اعتبار در این مبنا، ضریب آلفا است که توسط کرونباخ پیشنهاد شده

است. بحث این مقاله بر روي این روش از محاسبه اعتبار متمرکز شده است.

بررسی پیشینه پژوهشی نشان میدهد که ضریب آلفا داراي پیشفرضهاي مهم و

جدي است که عدم توجه به آن ها میتواند بر برآورد اعتبار اثر داشته باشد. این

١ گویه ها و عدم همبستگی بین « بودن (τ) معادل-تا و » پیشفرضها شامل اساساً

؛ خطاهاي اندازهگیري گویه ها میباشند (بیکون، سائور و یونگ، 1995 ؛ رایکوف ، 2001

2004 ؛ رایکوف و شراوت، 2002 ؛ کوماروف، 1997 ؛ گراهام، 2006 ؛ گرین و هرشبرگر،

2000 ). اساساً معادل-تاو بودن گویهها به یکسانی نمرات مشاهده شدة گویه ها یا

تساوي بار گویهها مرتبط است. عدم رعایت این پیشفرضباعث می شود که آلفا داراي

اعتبار کمتري باشد. به این دلیل در برخی مواقع اعتبار به عنوان مرز پائین اعتبار شناخته

.( میشود (رایکوف و شراوت، 2002 ؛ گراهام، 2006

و یا اندازه گیر ي در مقیاس یکسان) ) « معادل-تاو بودن گوی هه ا » براي بررسی

می توان انحراف معیار گویه ها را ملاحظه نمود. در صورتیکه انحراف معیار نمرات

گویههاي تشکیل دهندة یک آزمون از یکدیگر تفاوت زیادي داشته باشند، میتوان

چنین نتیجهگیري کرد که این گویهها احتمالاً در مقیاس متفاوتی اندازهگیري می شون د،

در غیر اینصورت، وجود مقیاس یکسان محتمل است. چنین بررسی میتواند توسط

41 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 41

ایجاد فواصل اطمینان پیرامون انحراف معیار انجام شود. به ای نصورت که با ایجاد

فواصل اطمینان حدود انحراف معیار، میتوان معادل بودن آنها را از نظر دیداري

بررسی کرد (گراهام، 2006 ). با این حال، رعایت نکات دیگر ي م یتواند اطمینان از

معادل-تاو بودن گویهها را حاصل کند. بهطور مثال، در صورتیکه از اشکال متفاوتی

براي دریافت پاسخ استفاده کنیم، احتمال معادل-تاو نبودن گویه ها زیاد خواهد بود

(گراهام، 2006 ). به عبارت دیگر، اگر در مقیاسی هم گویههاي صحیح و غلط و هم

گویههاي 5 درجهاي طیف لیکرت وجود داشته باشد، احتمالاً نمی توان این گویه ها را

گویههایی معادل دانست. وزنبندي یکسان گویه ها نیز از عوامل بهدست آوردن

گویههاي معادل-تا و است (بیکون، سائور و یونگ، 1995 ). در بیشتر مطالعات،

گویههاي آزمون با وزن یکسانی با همدیگر ترکیب می شوند . اگر گویه ها وزنهاي

یکسانی براي ترکیب و ایجاد یک متغیر ترکیبی نداشته باشند، احتمالاً مقیاس معادل-تاو

را نخواهیم داشت. از عوامل دیگري که بر معادل-تا و بودن اثر میگذارد، تعداد

٢ ضریب آلفا در آزمونهایی که تعداد « ک م برآورده شدن » ، گویههاست. به طوري که

گویههاي بیشتري دارند، کمتر اتفاق میافتد (گراهام، 2006 ). به این دلیل که با معاد ل-

تاو نبودن یک گویه مقدار کمی از سهم واریانس نمره واقعی تغییر می کن د و بنابراین

کم تر در معادل-تاو بودن مقیاس تأثیر می گذا رد. از طرف دیگر، در مقیاس هاي

کوچک تر، معادل-تاو نبودن یک گویه سهم بیشتري بر معادل-تاو بودن مقیاس دارد. با

اینحال، نتایج برخی از مطالعات نشان میدهد که وجود حتی یک گویه غیر معادل-تاو

میتواند بر دقت ضریب آلفا موثر باشد (رایکوف، 1997 ). با وجود اهمیت این نکات

هیچ روش دقیق و مشخصی بر اساس روشهاي مرسوم اندازه گیر ي براي بررسی

معادل-تاو بودن گویهها وجود ندارد.

٤« متجانس » ٣، معادل-تاو، اساساً معادل-تاو و « مدل موازي » بهطور کلی چهار نوع

وجود دارند که بسته به مفاهیم و عناصر محدود شده آن تعریف میگردند.

محدود ترین مدل اندازهگیري در تعریف نمرات واقعی است. در « مدل موازي » ¨

این مدل علاوه بر آن که همه گویههاي آزمون متغیر نهفتۀ یکسانی را میسنجند (مفهوم

تکوجهی بودن که در تمام آزمون هاي ثبات درونی فرض میشود)، فرضمیشود که

همه گویههاي آزمون دقیقاً معادل یکدیگر هستند. علاوهبرآن، همه گویه ها باید متغیر

42 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 42

نهفته را در مقیاس مشابهی اندازهگیري کرده که با درجه یکسانی از دقت و مقدار

یکسانی از خطا همراه باشند (گراهام، 2006 ). به عبارت دیگر، مقیاس اندازه گیر ي،

دقت و خطاي اندازهگیري همه گویهها یکسان در نظر گرفته می شود . این مطلب را

میتوان با استفاده از معادلهاي ریاضی آن به ترتیب به این صورت نشان داد:

(1) bi= … = bk = ۱

(2) ai=…= ak = ۰

(3) Var (E i) =…= Var (Ek)

ضریب بین متغیرهاي مشاهده و متغیر نهفته (بارهاي عاملی)، bi در این عبارت ها

(4) Ti = aij + bij Tj ضریب ثابت درمعادله ai واریانس خطاي اندازهگیري، و Var (Ei)

.( را نشان میدهد (رایکوف، 1997 Tj و Ti است. این معادله رابطه خطی بین نمرات

دارد به جز آنکه در این « مدل موازي » نیز ساختاري همانند « مدل معادل- تاو » ¨

مدل، خطاهاي واریانس گویهها میتوانند از همدیگر متفاوت باشند. این موضوع دلالت

بر این دارد که تکتک گویهها، متغیر نهفته یکسانی را در مقیاس یکسان و با درجه

دقت یکسانی اندازهگیري می کنند ولی احتمالاً میزان خطاي متفاوتی وجود دارد

1998 ؛ گراهام، 2006 ). معناي مفهومی این مدل آن است که اگرچه همه a ، (رایکوف

نمرات واقعیِ گویهها معادل هستند ولی هر گویه عبارتهاي خطاي منحصر به فردي

( دارد. بر حسب عبارات ریاضی پیشین میتوان گفت که در مدل معادل- تاو عبارت ( 3

درنظر گرفته نمیشود.

فرضمیکند که هر گویه، متغیر نهفته یکسانی را در « مدل اساساً معادل- تاو » ¨

یک مقیاس یکسان ولی با دقت احتمالاً متفاوتی اندازهگیري میکند. علاوهبراین، در این

مدل همانند مدل معادل-تاو احتمالاً خطاهاي اندازهگیري نیز متفاوت هستند (رایکوف،

1997 ). در این تعریف تفاوت بین دقت و مقیاس گویه برجسته شده است. در مدل

معادل- تاو فرض میشود که نمرات واقعی گویهها معادل هستند، ولی در مدل اساساً

معادل- تاو نمره واقعی گویه میتواند توسط ترکیب با یک ضریب یگانه اضافی به هر

زوج از متغیر ها متفاوت باشد. این پیشفرضبهشکل ریاضی اینگونه نوشته میشود:

(۵) Xik = (αk + Ti) + Eik

43 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 43

عبارت فوق این حقیقت را منعکس میکند که اگرچه نمرات واقعی گویهها در

مقیاس یکسانی اندازهگیري میشوند (یعنی واریانس مشابهی دارند)، ولی ممکن است

دقت متفاوتی (میانگینهاي متفاوت) داشته باشند. گنجانیدن ضریب اضافی تنها بر

میانگین گویهها تأثیر میگذارد، ولی بر واریانس و کوواریانس آنها متفاوت نیست

(گراهام، 2006 ). بر حسب عبارتهاي مشخص شده در مدل موازي، میتوان مدلی را

دانست که عبارت هاي ( 2) و ( 3) را رعایت نکرده باشد. براي « مدل اساساً معاول-تاو »

استفاده از ضریب آلفاي کرونباخ لازم است که اندازهگیري حداقل بر مبناي مدل اساساً

معادل-تاو استوار شده باشد. به این معنا که مقیاس و نمرات واقعی گویه ها یکسان

باشد.

در نهایت کمترین محدودیت در آن وجود دارد و به همین دلیل « مدل متجانس » ¨

است. در این مدل فرضمیشود که « اعتبار » عمومی ترین مدل براي استفاده در برآورد

تک تک گویهها متغیر نهفته یکسانی را با مقیاس، دقت و میزان خطاي احتمالاً متفاوت

مدل » اندازهگیري میکنند (آدامسون، شولین، لوید و لوئیس، 2000 ؛ گراهام، 2006 ). در

مدل اساساً » در این است که در « مدل با مدل اساساً معادل-تاو » تفاوت این « متجانس

٥با همدیگر متفاوت « جم عپذیر ي » نمرات واقعی گویهها توسط ضریب « معادل-تاو

هستند، در حالیکه در مدل متجانس بین نمرات واقعی گویهها رابطه خطی فرض شده

و بین هر زوج از آن ها، ضریب جم عپذیر یگانهاي وجود دارد که میتوان آنرا به این

:(1998a ، صورت نشان داد (رایکوف

(۶) Xj = aj + bj T۱

عموم یترین مدل « مدل متجانس » بهطوري که در عبارت ( 6) ملاحظه میشود

اندازهگیري است، زیرا میتوان با رعایت هریک از پیشفرضهاي مدلهاي قبلی، مدل

متجانس را به یکی از مدل هاي محدودتر تبدیل کرد. بنابراین، سه مدل مورد اشاره در

هستند و به همین دلیل است که برخی از « مدل متجانس » بالا زیر مجموعه هاي

صاحبنظران سایر مد لهاي اندازهگیري را یکی از حالتهاي مدل متجانس می دانند

.( (رایکوف و هانکوك، 2005

براي تطبیق داده هاي حاصل از اندازهگیري با هر یک از مدلها از ویژگی سلسله ¨

مراتبی مدل هاي اندازهگیري استفاده میشود. به عبارت دیگر، براي انتخاب بهترین

44 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 44

مدل، از نامحدودترین و غیراقتصاديترین مدل بهسوي محدودترین و اقتصاديترین

مدل حرکت می شود تا بهینهترین مدل انتخاب گردد (گراهام، 2006 ). بدین منظور از

٦ استفاده میشود، یعنی ابتدا از مدل متجانس شروع شده و برازش « مدلهاي آشیانهاي »

این مدل با دادهها آزمون میشود. در صورت معنیداري، مدل معادل-تا و و یا اساساً

معادل-تاو آزمون میشود، یعنی مدلی که بارهاي عاملی آن برابر با یک درنظر گرفته

میشود. در صورتیکه تفاوت در مقادیر آمارة خیدو بین این دو مدل از نظر آماري

معنیدار نبود مدل محدودتر انتخاب شده و در غیر اینصورت مدل اولی و محدودتر به

عنوان مدل مناسب برگزیده میشود. در صورتیکه مدل معادل -تاو پذیرفته ش ود، مدل

موازي آزمون میگردد و خطاهاي اندازهگیري گویهها برابر فرضم یگردند . پس از

آزمودن مدل، تفاوت مقادیر خیدو (آماره تفاوت خیدو) بررسی می گردند . همانند

مرحله قبلی، در صورت معنیدار نبودن آماره تفاوت خیدو مدل محدودتر و در غیر

این صورت مدل نامحدودتر انتخاب می گردد (رایکوف، 1997 ). بنابراین، با توجه به

٧ در اندازهگیري، اگر دو مدل بهطور منطقی برازش پیدا کنند، برآورد « بهینه بودن » اصل

مدل محدودتر از مدل با محدودیت کم تر ترجیح داده خواهد شد. به این دلیل توصیه

شده است که قبل از انجام ه رگونه عمل اندازهگیري، پیش فرض هاي برآورد اعتبار

آزمون شده و مناسبترین مدل در رابطه با دادهها انتخاب گردد.

نیز از جمله شرایط استفاده از ضریب « خطاي اندازهگیري ناهمبسته » پیشفرض ¨

آلفا است. مطالعات نشان دادهاند که همبستگی بین خطاهاي اندازهگیري بر روي برآورد

2004 ؛ کوماروف، 1997 ؛ گرین و هرشبرگر، ؛ ضریب آلفا موثر است (رایکوف، 2001

2000 ؛ لوك، 2005 ). عمده مطالعات در این زمینه نشان میدهند که انحراف از

پیشفرض خطاهاي مستقل میتواند ضریب آلفا را متورم ساخته و در نتیجه ضرایب

آلفا بیش از مقدار واقعی آن برآورد گردند (کوماروف ، 1997 ؛ گرین و هرشبرگر،

2000 ). با اینحال، برخی از نوشتهها حاکی از کم برآورد کردن اعتبار در هنگام همبسته

2004 ). ولی بهطور کلی با توجه به ؛ بودن خطاهاي اندازه گیري دارد (رایکوف، 2001

پژوهشهایی که بهطور منظم این موضوع را بررسی کردهاند، میتوان چنین برداشت

کرد که چنانچه بین خطاهاي اندازهگیري در یک آزمون، همبستگی و به خصوص

٨ میکند (زیمرمن، زومبو « بیشبرآورد » همبستگی مثبت وجود داشته باشد، آلفا اعتبار را

45 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 45

و لالونده، 1993 ). این موضوع در مطالعه دیگري نیز تأئید شد و بر اساس آن مشخص

گردید که وجود خطاي همبسته میتواند تا اندازه اي، مقداري از کمبرآورد شدن اعتبار

به علت معادل-تاو نبودن را کاهش دهد (کوماروف، 1997 ) که معر ف تعامل رعایت

نکردن هر دو پیشفرضاست. مقدار سوگیري آلفا در هنگام بروز خطاهاي همبسته

قابل محاسبه خواهد بود (رایکوف، 2001 ). ناهمبستگی بین خطاهاي اندازه گیر ي از

٩ بهدست میآید. استقلال آماري به دو موضوع اشاره « استقلال آماري » طریق اجراي

دارد: اول آنکه مقدار مشاهده شدة افراد در یک گویه مستقل از مقادیر آنها در

گویههاي دیگر باشد و دوم اینکه مقدار مشاهده شدهي افراد در گویه بهطور آزمایشی

از مقدار مشاهده شده ي هر فرد دیگر در آن گویه یا گویه ها ي دیگر متفاوت باشد

(کوماروف، 1997 ). بنابراین پیشفرض استقلال آماري در هنگامیکه آزمون مشابه

باشند یا گویههاي مقیاس، تقریب همزمان نزدیکی داشته باشند، غیر قابل دفاع خواهد

بود. همبستگی بین خطاهاي اندازهگیري به دلایل متفاوتی رخ میدهد که از آن جمله

وجود یک نظم مشخص بین گویهها خواهد بود. در نتیجه براي پرهیز از بروز چنین

مشکلی میتوان براي به حداقل رساندن ثبات تصنعی، نظم گویهها را بهصورت تصادفی

تنظیم کرد. به عبارت دیگر با اینکار میتوان امیدوار بود که پاسخ افراد به نمره واقعی

آنها وابسته است و نه به پاس خهاي آنان در گویههاي قبلی. علاوهبراین، مواردي چون

اجرا شدن همه گویهها در یک مقیاس بهطور متوالی و در یک وضعیت یکسان، داشتن

عبارتپردازي یکسان و نمرهگذاري در یک جهت نیز از مواردي است که همبستگی

بین گویهها و خطاها را افزایش داده و در نتیجه ضریب آلفا را بیشبرآورد خواهد کرد

.( (گرین و هرشبرگر، 2000

دشواري رعایت پیشفرض ها به همراه فقدان قابلیت بررسی و آزمون آنها در ¨

روشهاي مرسوم اندازهگیري، ابهاماتی را در دقیق بودن ضریب آلفا بهوجود میآورد. به

همین خاطر معمولاً از ضریب آلفا به عنوان برآورد غیردقیق اعتبار یاد م یشو د. با

اینحال، در مواقعی که تعداد نسبتاً زیادي از مولفهها وجود داشته باشند (بیشتر از 6)، یا

0) و خطاهاي / بارها بهطور بالایی در یک سازة نهفتۀ مشترك بار داشته باشند (حداقل 6

اندازهگیري ناهمبستهاي وجود داشته باشند استفاده از آلفا مجاز خواهد بود (رایکوف ،

.(2004 ؛2001

46 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 46

با توجه به مطالبی که گفته شد میتوان نتیجه گرفت که در استفاده از ضریب ¨

حداقل دو مشکل وجود دارد. مشکل اول برآورده کردن « شاخص اعتبار » آلفا به عنوان

پیشفرضهاي لازم براي استفاده از ضریب آلفا و مشکل دوم آزمون کردن هر یک این

پیشفرضها در رابطه با دادههاي در دسترس میباشد. براي حل مشکل اول روشهاي

جايگزین ضریب آلفا پیشنهاد شده است. به عنوان نمونه در پیشفرض ناهمبسته بودن

خطاهاي اندازهگیري گویهها، در مدل معادلات ساختاري خطاهاي اندازه گیر ي را به

خطاي همبستۀ تولید شده توسط عامل و خطاي همبسته تولید شده توسط خطاي

اندازهگیري تفکیک میکنند. خطاي همبستهاي که توسط عاملها تولید م یشود واریانس

معتبر را مورد توجه قرار میدهد، در حالیکه خطاهاي همبسته تولید شده توسط خطاي

.( را درنظر میگیرند (گرین و هرشبرگر، 2000 « نامعتبر » اندازهگیري تصادفی واریانس

براي مواقعیکه مدل اساساً معادل-تاو نیست نیز روشهاي دیگري جايگزین ضریب

آلفا شدهاند که از آن جمله روش امگا یا معادل آن روش اعتبار سازه (بیکون، سائور و

یونگ، 1995 ؛ رایکوف و شراوت، 2002 ؛ زینبرگ، رول و یوول، 2007 )، روش امگ اي

وزنبندي شده (بیکون، سائور و یونگ، 1995 ) و روش ه اي موجود در روش مدل

معادلات ساختاري هستند. براي حل مشکل دوم (عدم توانایی براي آزمون کردن

پیشفرضها) مناسبترین و رایجترین روش، استفاده از مدل معادلات ساختاري است.

در این مقاله سعی میشود که جنبه هاي استفاده از شاخص ها و روشهاي ویژه موجود

در مدل معادلات ساختاري براي برآورد اعتبار و همچنین آزمون پیش فرض ها مورد

بررسی قرار گیرند. همچنین برخی مطالعات نشان دادهاند که ضریب آلفا نسبت به

( وجود نقاط پرت تأثیرپذیر است (لیو و زومبو، 2007

کاربرد روش مدل معادلات ساختاري در برآورد اعتبار ابزار به علت قابلیت ها و ¨

مزایاي استفاده از آن رواج یافته است. مهمترین دلیل استفاده از این روش عدم اجبار

براي رعای تکردن پیشفرض هاي سخت و جدي است که در روش آلفا وجود دارد. در

این روش امکان آن وجود دارد که از مدل اندازهگیري کمتر محدودشده اي همانند مدل

متجانس استفاده شود و در نتیجه الزام استفاده از مدل اساساً معادل -تاو از بین می رود

(آدامسون و همکاران، 2000 ؛ رایکوف، 1997 ؛ رایکوف و شراوت، 2002 ). خطاهاي

ناهمبسته نیز از جمله پیشفرضهاي اساسی در ضریب آلفاست که به عنوان همبستگی

47 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 47

خطاي اندازهگیري درنظر گرفته میشود، ولی در روش مدل معادلات ساختاري کاملاً

١٠ درنظر گرفته نمیشود بلکه به عنوان « خالصیا ناب » به صورت خطاي اندازهگیري

عوامل باقیمانده مشخصنشده مورد توجه قرار میگیرند. این نمرات باقیمانده هم

مولفههاي تصادفی و هم مولفههاي غیرتصادفی را در بر می گیرند. خطاهاي همبسته

بهصورت همپراکندگی تولید شده توسط مولفههاي غیرتصادفی یا عواملی هستند که

لزوماً بهصورت نااعتبار ملاحظه نمیشوند (گرین و هرشبرگر، 2000 )، در نتیجه می توان

بین خطاهاي اندازهگیري گویهها همبستگی درنظر گرفت. به عبارت دیگر، دو گویه

می توانند تأثیرات تصادفی مشترکی را دربرگیرند که در نمرات خطاي مرتبط با آنها

مشترك بوده و به همبستگی بین این خطاها منجر شوند (رایکوف، 2001 ؛ کوماروف،

1997 ). علاوه بر مزیت آزاد بودن از رعایت پیش فرض ها، در روش هاي برگرفته از

مدل معادلات ساختاري امکان محاسبه اعتبار با استفاده از عملکرد وزنبندي کردن

گویهها نیز وجود دارد. استفاده از بارهاي غیر مساوي گویه ها براي برآورد اعتبار در

زمانی که گویهها بهطور مساوي بر برآورد ساز هها تأثیر نمیگذارند، مفید است (بیکون،

1998 ). همچنین به علت انعطاف بالاي روش مدل a ، سائور و یونگ، 1995 ؛ رایکوف

معادلات ساختاري امکان بررسی تفاوتهاي گروهی در اعتبار مرکب، بررسی تفاوت

اعتبار در نسخههاي متفاوت ابزار اندازه گیري (مثلاً نسخه قلم و کاغذي در مقابل نسخه

1998 )، به دست a ، رایانهاي) (رایکوف، 2004 )، استفاده از دادههاي مقوله اي (رایکوف

آوردن خطاهاي معیار و فواصل اطمینان براي اعتبار مرکب در حالتی که به پیش فرض

،( 1998 ؛ رایکوف و شراوت، 2004 a ، نرمال بودن مولفهها وابسته نباشند (رایکوف

فراهم میگردد. امکان محاسبه میزان سوگیري و کمبرآوردي ضریب آلفا نیز از دیگر

2001 ). به تمامی ؛1998b ؛ قابلیتهاي روش مدل معادلات است (رایکوف، 1997

مزایاي اشاره شده میتوان امکان آزمون کردن پیشفرضها را اضافه نمود که با سایر

روشها قابل انجام نیست.

با وجود مزایاي مدل معادلات ساختاري در برآورد اعتبار، ملاحظاتی در مورد

استفاده از این روش باید انجام پذیرد که مهمترین آن نیاز به نمونههاي بزرگ

مشارکتکنندگان است. این امر بهویژه در مورد دادههاي طبقهاي که تعداد محدودي

گزینه براي پاسخ دارد، از اهمیت خاصی برخوردار است زیرا در اینگونه مواقع روش

48 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 48

١١ براي آزمون مدل مورد نیاز بوده که این « مجذورات وزنبندي شده » برآورد حداقل

روش حساسیت زیادي در مورد استفاده از نمونههایی دارد که به طو ر بهینه بزرگ

2004 ). لذا در این موقعیتها استفاده از ؛2001 ؛ شناخته میشوند (رایکوف، 1997

نمونههاي کوچک براي برآورد اعتبار مرکب گمراهکننده است. علاو ه بر ای ن، تعداد

گویهها ملاحظه قابل توجهی در آزمون مدل هاي اندازهگیري بهشمار میرود. در مواقعی

که تنها دو گویه وجود داشته باشد، روشهاي محاسبه اعتبار تنها براي مدل هاي موازي

یا معادل -تاو قابل کاربرد هستند زیرا براي حالت آزمون موازي، مدل دو پارامتر آزاد

١٢ است (درجه آزادي برابر با یک است). در این « بیششناساییشده » دارد و بنابراین

موقعیت با افزودن محدودیتهاي اضافی همچون برابري بارهاي شاخص(مدل معادل-

تاو) و یا برابري واریانس خطا (مدل موازي) مدل در حالت قابل برازشی قرار میگیرد

(رایکوف و هنکوك، 2005 ). براي مدل معادل -تاو، این مدل سه پارامتر آزاد دارد و

١٣ است (درجه آزادي برابر با صفر است). مدل متجانس در این « کاملاً شناساییشده »

وضعیت کم شناساییشده بوده (درجه آزادي آن منفی است) و بنابراین کاربرد عملی

ندارد (یورسکاگ و سوربوم، 1993 ). در زمانی که سه گوی ه وجود دارد، مدل متجانس

١٤« مدل اشبا عشد ه » کاملاً شناساییشده و قابل برآورد میشود ولی نمی توان آن را با

.( مقایسه کرد زیرا هر دوي این مدلها داراي درجه آزادي صفر هستند (رایکوف، 1997

با گویههاي بالاتر از چهار، تمامی مدلها کم شناسای ی شد ه بوده و در مقابل مدل

اشباعشده قابل دفاع خواهند بود.

در استفاده از مدل معادلات ساختاري براي برآورد اعتبار روشهاي مختلفی ¨

پیشنهاد شده است. بهطور کلی می توان این روشها را به دو دستهي روش ه اي مبتنی

بر تک تک گویهها یا متغیرهاي مشاهده شده و روشهاي مبتنی بر ترکیب متغیرهاي

مشاهده شده تقسیم نمود. گرایش بیشتر پژوهشگران و صاحبنظران بر استفاده از

روشهاي مبتنی بر ترکیب گویه هاست تا به این وسیله بتوانند جایگزینهاي مناسبی را

براي روشهاي مرسومی همچون آلفا پیشنهاد دهند. با این وجود در ابتدا روش ه اي

مبتنی بر تک تک گویهها معرفی میگردند.

مشخصشد که اعتبار قسمتی از اندازهگیري است که مشمول « اعتبار » در مفهوم ¨

اعتبار به عنوان ،« مدل معادلات ساختاري » خطاي تصادفی نمیشود. بنابه تعریف در

49 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 49

تعریف میشود (راین س- « واریانسی که به وسیله خطاي اندازهگیري تبیین نمیشود »

128 ). مشهورترین شاخصی که بر مبناي بررسی ت کتک گویه ها معرفی ، اودي، 2000

١٥ نام دارد که نشا ندهند ه مقدار « ضریب مجذور همبستگی چندگانه » ، شده است

توسط متغیر نهفته است (راینس- اودي، 2000 ؛ قاضی x واریانس تبیین شده در متغیر

طباطبایی، 1377 ؛ یورسکاگ و سوربوم، 1993 ). این شاخص به عنوان حد پائین اعتبار

مورد توجه قرار میگیرد، به این معنی که اعتبار هر گویه حداقل برابر x براي متغیرهاي

با مجذور همبستگیهاي چندگانه است (قاضی طباطبایی، 1377 ؛ یورسکاگ و سوربوم،

1993 ). مقادیر این شاخص از طریق خروجیهاي برنام ههاي رایانه اي مدل معادلات

بهدست میآیند و مقدار آن بین صفر و یک است. جهت LISREL ساختاري همچون

0 به عنوان ضرایب مناسب درنظر گرفته / تفسیر این شاخص ها، مقادیر بالاتر از 5

میشوند (راینس- اودي، 2000 ). همچنین جداي از این شاخص، همبستگی هر گویه

با متغیر نهفته در هر زیرمقیاس نیز به عنوان ضریبی براي ثبات درونی هر گویه معرفی

.( شده است (عابدي، 2002

راهبرد دوم ترکیب متغیرها که رواج زیادي پیدا کرده است، ترکیب همه گویه ها ي

١٦ یاد می شو د. این « اعتبار مرکب » یک عامل با همدیگر است که از آن روش به عنوان

روش بر اساس مفهوم اصلی اعتبار در نظریه کلاسیک آزمون بنا شده است که اعتبار را

به عنوان سهم واریانس نمره واقعی به واریانس نمره مشاهده شده درنظر میگیرد. بدین

منظور لازم است که برآوردهایی براي واریانس نمره واقعی و واریانس نمره مشاهده

شده داشته باشیم. واریانس نمره مشاهده شدهي یک اندازه میتواند توسط ایجاد یک

متغیر مشاهده شده ترکیبی در دسترس قرار گیرد که توسط جمع واریانسهاي تکتک

متغیرهاي مشاهده شده بهوجود میآید (گراهام ، 2006 ). در این روش یک شاخص

آماري براي برآورد اعتبار مجموعه اي از گویهها که در یک عامل قرار دارند ارائه

میشود. با توجه به نوع ترکیب گویهها و وضعیت خطاهاي آنها (با خطاي همبسته و

بدون خطاي همبسته) فرمولهاي چندگانهاي پیشنهاد شده است که قابل تبدیل به

یکدیگر میباشند. در حالت کلی و مدلهاي متجانس و ه مچنین گویه ها ي وزنبندي

، نشده، اعتبار مرکب بهوسیله این فرمول بهدست می آی د (آدامسو ن و همکارا ن، 2000

:(345 ، 973 ؛ رایکوف، 2004

50 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 50

å å

å

= =

=

+ k

i 1 ii

k

i 1

2

i

k

i 1

2

i

( )

( )

b

b θ ( = اعتبار مرکب ( 7

å= دراین عبارت

k

مجموع ضرایب بین متغیرهاي مشاهده شده و نهفته i 1bi

å= گویه و k ( (بارعاملی

k

i 1 ii گویه را نشان م یده د. در k مجموع واریانس هاي خطاي θ

صورتیکه بین خطاهاي اندازهگیري همبستگی وجود داشته باشد، از فرمول زیر استفاده

:(344 ، میشود (رایکوف، 2004

å å å

å

= = £ < £

=

+ +

1 i j k jj

k

i 1 ii

k

i 1

2

i

k

i 1

2

i

( ) θ 2 θ

( )

b

( اعتبار مرکب ( 8 = b

کوواریانس خطاي غیرصفر است. qjj(1£i< j£k) در این عبارت

این دو فرمول قابل تبدیل به وضعی ت گوی ه ها ي وزنبندي شده هستند. در

این حالت، گویهها با وزنهاي خاصی با همدیگر ترکیب شده و نمره مرکبی را بهوجود

میآورند. نمره مرکب از طریق عبارت زیر بهدست میآید:

(9)Y = w1y1 + w2y2 + ... + wkyk

از پیش مشخصهستند (چگونگی بهدست wk ،... ،w2 ،w دراین عبارت وزن هاي 1

آوردن وزنها در قسمت هاي بعدي توضیح داده خواهد شد). اعتبار مرکب یک آزمون

:(344 ، وزنبندي شده از طریق فرمول زیر محاسبه میگردد (رایکوف، 2004

å å

å

= =

=

+ k

i 1 ii

2i

k

i 1

2

i

k

i 1

2

i

( i ) θ

( i )

w b w

( اعتبار مرکب ( 10 = w b

:(345 ، در حالت خطاهاي همبسته (رایکوف، 2004

å å å

å

£ < £

= =

=

+ +

1 i j k

i j jj

k

i 1 ii

2i

k

i 1

2

i

k

i 1

2

i

( i ) θ 2 w w θ

( i )

w b w

( اعتبار مرکب ( 11 = w b

روش هایی که در بالا توضیح داده شد، برآورد نقطه اي اعتبار مرکب را نشان

میدهند. میتوان با استفاده از روشهایی برآورد فاصله اي اعتبار مرکب را نیز محاسبه

کرد. برآورد فاصلهاي در مطالعات اعتبار میتواند مفید باشد. بر پایه چنین روشهایی

نتایج حاصل از برآورد اعتبار به فواصل مشخصی تعریف میشود (رایکوف و شراوت،

.(2002

51 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 51

علاوه بر روش بالا م یتوان اعتبار مرکب را از طریق تعریف پارامترهاي جدید در

١٧ در مدلها محاسبه نمود. این کار از طریق تعریف « برازش شده » یک مدل از قبل

١٨ امکانپذیر است. در این روش با محدود کردن ضرایب در نمرات « متغیر خیالی »

مشاهده شده، نمرههاي مشاهده شده به مجموع نمرات خطا و نمره واقعی تجزیه

نامیده میشوند، با همدیگر ترکیب میگردند تا نمره Xi میشوند. سپس این نمرات که

به وجود آید. مجذور همبستگی متغیر خیالی با متغیر نهفته اعتبار مرکب (F) متغیر خیالی

آزمون را نشان خواهد داد (رایکوف ، 1997 ؛ گراهام ، 2006 ). شکل نمادین ساخت

متغیر خیالی در شکل 1 مشخصشده است.

.(176 ، شکل 1- چگونگی ساخت متغیر خیالی (منبع: رایکوف، 1997

می توان بهجاي محدود کردن پارامترها در عدد یک، از وزنهاي شناخته شدهاي

براي هریک از مسیرها استفاده کرد. در انتخاب این وزنها (wk ،... ،w2 ،w (همچون 1

میتوان یا از پژوه شهاي قبلی و یا از دانش نظري توسط صاحبنظران استفاده کرد.

T

X٢ X٣ … Xk

F

E٢ E٣

Ek

١

١ ١

٭ ٭ ٭

٭٭٭

١ ١

52 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 52

همچنین با توجه به قابلیت عدم الزام براي تشخیص دقیق ضرایب مسیر، میتوان از

به عنوان وزن استفاده نمود (رایکوف ، 1997 ). بنابراین با (λi) برآوردهاي بار عاملی

میتوان متغیر خیالی را بهوجود wi=λi محدود کردن ضرایب نمرات مشاهده شده در

آورده و از طریق آن برآوردي از اعتبار مرکب وزنبندي شده را بهدست آورد. به طور

کلی کاربرد این روش با استفاده از نرمافزارهاي آماري مدل معادلات ساختاري قابل

انجام است. دراستفاده از این روش باید بهخاطر داشت که از مدلهایی استفاده گردد که

قبلاً ساختار آنان برازش یافته باشد.

١٩« اعتبار بیشینهاي » در نهایت، روش آخري که مورد بحث قرار می گیرد، ضریب ¨

است که به عنوان شاخص اعتبار سازه تعریف میشود که میتوان سازه نهفته را

توسط شاخصهاي سازه درنظر « لحاظ شده » بهصورت مقداري تعریف شده و یا

گرفت (رایکوف و هنکوك، 2005 ). اعتبار بیشینهاي به عنوان آخرین شاخص براي

برآورد اعتبار در روش مدل معادلات ساختاري پیشنهاد شده است. این شاخص از

ترکیب مجموعهي از پیش تعریف شدهاي از مولفههاي متجانس با عبارتهاي خطاي

ناهمبسته تشکیل شده است. این روش میتواند در ساخت، توسعه و تجدید نظر مقیاس

بهینه به کار آید. قابلیت مهم آن در سنجش تغییرات اعتبار بیشینهاي در نتیجه حذف و یا

افزودن یک یا چند اندازه است. همچنین با استفاده از ترکیب خطی وزنبندي شده

می توان اعتبار مرکبی را بهوجود آورد که داراي بالاترین درجه تفکیکپذیري در جنبه

نهفته مورد نظر بوده و حداقل واریانس خطاي نسبی ممکن را داشته باشد. با این

ترکیب وزنبندي شده آماره رضایتبخشی از نمره توانایی نهفته بهدست م یآید .

بررسیهاي تجربی نشان میدهند هنگامیکه نمرات عامل با روش برآورد حداقل

٢٠ در یک مدل تکعاملی برآورد م یشود، اعتبار بیشین هاي با « مجذورات عمومی شده »

روش متغیر خیالی (مجذور همبستگی بین عامل و ترکیب برآورد کننده ه ا) مساوي

.( است (رایکوف و هنکوك، 2005

تعیین وزن ها از اهمیت خاصی برخوردار است. « اعتبار بیشینهاي » در روش ¨

روشهاي متفاوتی براي اینکار پیشنهاد شده که در قبل به چند مورد از آنها اشاره شد.

در تکمیل این بحث دو روش دیگر نیز معرفی میشود که اولی به صورت نسبت بار

53 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 53

عاملی به خطاي آن است که میتوان آنرا بهصورت زیر نوشت (کانجر، 1980 ، به نقل

:( از رایکوف و هنکوك، 2005

(i , ,...,m) θ

w β

i

* i

i (12) = =12

دومین روش که کاربرد زیادي در اعتبار بیشینهاي دارد به نسبت مجذور بارهاي

به خطاي مرتبط با آن تعریف میگردد که به این صورت (η اندازهها در جنبه مشترك ( 1

آنرا میتوان نشان داد:

( ,..., ) * i m

i

i

wi 1,2

2

= = q

(13) b

(ρi با ملاحظه چگونگی محاسبه وزن ها، ضریب اعتبار بیشینه اي جامعه

(* به این

:(68 ، صورت محاسبه میشوند (رایکوف و هنکوك، 2005

å

å

=

=

+

= m

i 1 i i

m

* i 1 i i

(m) ( )

( )

θˆ

βˆ

θˆ

βˆ

ρˆ 2

2

1

(14)

آزمون تغییرات در اعتبار بیشینهاي به عنوان نتیجهاي از حذف و افزودن متغیرها ¨

یکی ازجنبههاي مهم این روش است. بنابر این روش، اگر بخواهیم که ابزاري با

اندازه متجانس m بالاترین اعتبار بیشینه اي را از طریق مجموعه از پیشتعریف شده اي با

باید بالاترین نسبتهاي مجذور بار ،(m>k) ،( اندازه k در اندازه معینی بسازیم (مثلاً

شاخص در واریانس خطاي مرتبط ( )

θ

β

i

i

2 را انتخاب کنیم. در نمونههاي معین از جامعه

مورد علاقه، ترتیب رتبه و انتخاب باید بر حسب نسبتهاي

q

b

ˆ

ˆ

i

از (i = 1,2,...,m) ، i

مولفه انجام میشود. پس از انتخاب m پارامترهاي برآورد شده در هنگام برازش مدل با

مولفه، برآورد بیشینهاي مجموعه کوچکتر محاسبه میشود و سپس آزمون معنی داري k

تغییرات در اعتبار بیشینهاي انجام میشود. فرضصفر در این آزمون به این صورت

است:

r r*

( )

*

H0 (m) = k (15) =

c2 c2 c آماره آزمون بر اساس 2

m k m k

D = -

( , ) محاسبه شده که براي نمونههاي بزرگ

درجه آزادي پیروي میکند. اگر خیدو تفاوت معن یدار m-k از توزیع خیدو مرکزي با

بود، فرض صفر رد می شود و نتیجه گرفته می شود که اعتبار بیشینهاي به عنوان نتیجه اي

m-k اندازه، کاهش خواهد یافت و یا با افزودن m مولفه از مجموعه اولیه m-k از حذف

54 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 54

اندازه اعتبار افزایش خواهد یافت (رایکو ف و هنکوك، k اندازه در مجموعه اولیه

2005 ). ذکر این نکته لازم است چنان چه در اعتبار بیشین هاي فرضمیشود هنگام

حذف اندازهها از مجموعه اولیه اندازههاي متجانس، هیچ گاه اعتبار بیشین هاي بالاتري

بهدست نمیآید و تنها میتوان بررسی کرد که آیا کاهش چندین اندازه میتواند از نظر

آماري بر کاهش اعتبار بیشینهاي موثر باشد یا نه؟ برآورد نقطهاي میزان تغییرا ت اعتبار

بیشینهاي نیز میتواند با استفاده از فرمول مربوطه و همچنین متغیر خیالی بهدست آید.

توجه به ملاحظاتی لازم است؛ از جمله آنکه « اعتبار بیشینهاي » در استفاده از ¨

و همراه با رعای ت k= تعداد اندازهها در کوتاهترین ابزار مورد بررسی باید به میزا ن 2

باشد. همچنین براي کاربرد این روش با نرمافزارهاي موجود کنونی، باید m>k

مولفه هاي (تقریباً) پیوستهاي را مورد بررسی قرار داد، در غیر اینصورت میتوان از

٢١ استفاده نمود. علاو ه بر ای ن، این « ساخت بسته » ماتریس همبستگی پلیکوریک و یا

روش بر اساس مولفههاي متجانس و خطاي اندازهگیري ناهمبسته استوار شده است.

بنابراین، اگر حداقل یکی از این پیشفرضها رعایت نشود، مدل توصیف شده ممکن

٢٢ باش د « زیربهینهاي » است نتایج گمراه کنندهاي را بهبار آورده و مستلزم ترکیب ابزار

(رایکوف و هنکوك، 2005 ). بنابراین قبل از اینکه از این روش استفاده شود، باید مدل

تکعاملی در همه مولفهها برازش شده و برازش آن براي قابل دفاع بودن و مناسب

بودن شاخصهاي اصلاح در کوواریانس خطا مشخصشود.

مقدمه اي بر همتراز سازي (equating) كه معادل سازي يا برابرسازي نيز ترجمه شده است

در بسیاري از موقعیت هاي روانشناختی و آموزشی، چندین فرم از یک آزمون براي سنجش

توانایی پیشرفت عملکرد و مانند آن قابل استفاده است. وقتی چند فرم آزمون براي اندازه گیري

توانایی یکسانی اجرا می شود در حقیقت قادر به مقایسه نمرات آزمون افراد هستیم با آزمون هاي

موازي این کار به صورت مستقیم انجام می شود. آزمون هاي موازي محتواي یکسانی را اندازه می

گیرند و ویژگی آماري مشترکی دارند ( تساوي میانگین، انحراف استاندارد و پایایی).

نمره ها در آزمون هاي موازي کاملاً قابل تعویض بوده و هیچ مشکلی در زمینه مقایسه

نمرات در فرم هاي موازي آزمون پیش نمی آید. اغلب، چند فرم از یک آزمون که ویژگی

یکسانی را اندازه می گیرند موازي نبوده و مقایسه ي نمرات به راحتی انجام نمی شود چون

فرم هاي مختلف آزمون در چند خصوصیت با هم تفاوت دارند (عدم تساوي میانگین ها،

واریانس ها، پایایی ها و مانند آن) بنابر این قبل از مقایسه نمرات آزمودنی ها در چند فرم از

یک آزمون ایجاد تعادل بین نمرات خام در فرم هاي مختلف از یک آزمون لازم است این عمل

همتراز سازي 1 آزمون ها نام دارد. اگر چه نظریه پردازان و عمل کنندگان به نظریه ها با هم

اختلاف عقیده دارند براي نمره هاي همتراز شده شرایطی وجود دارد که باید به اتفاق نظ ر

برسند مانند شرایطی که بعد از اجراي روش هاي همتراز سازي نمرات بدست آمده است.

روش همتراز سازي نه فقط باید بتواند توانایی مبادله ي نمرات را داشته باشد بلکه باید

به محتواي آزمون و جامعه هدفی که آزمون براي آنها در نظر گرفته شده نیز مربوط باشد.

به منظور دقت بیشترچهار ویژگی لازم براي نمره هاي آزمون همتراز شده در زیر آمده

(2005 است. ( گراجتر و وندرکمپ 2

خانم دكتر اكبري

نحوه ی برخورد با داده های پرت و انتهایی

برای شناسایی داده های پرت و انتهایی راههای متفاوتی وجود دارد. یک قانون سر انگشتی بیان می کند انحراف بیشتر از سه انحراف استاندارد را باید داده ی پرت در نظر گرفت که البته این موضوع برای داده های چوله نامناسب است. برای داده های دارای توزیع چوله نقاط برشی مطرح شده است. زمانی که توزیعات چند متغییری داریم شاخص هایی از فاصله مطرح می شوند مانند فاصله ی ماهالانوبیس و d کوکس. باقیمانده ی استاندارد شده و یا استیودنت شده مربوط به رگرسیون نیز می توانند در شناسایی مفید باشند.

با توجه به ویژگی داده های گردآوری شده در این مرکز بهترین راه عبارت است از استفاده از نمودار scatter plot زمانی که موضوع مورد بحث ما همبستگی است و استفاده از نمودار Box plot زمانی که موضوع مورد بحث مقایسه ی تفاوت ها است و یا این که لازم است تنها یک گروه مورد مطالعه قرار گیرد.

بعد از شناسایی داده های پرت و انتهایی باید در مورد نحوه ی برخورد با آنها تصمیم گرفته شود. در صورتی که تعداد این داده ها زیاد نباشد می توان آنها را از فرایند تحلیل کنار گذاشت. به این روش حذف گفته می شود. اگر تعداد این داده ها زیاد باشد یا محقق به هر دلیلی بخواهد از اطلاعات موجود از آنها استفاده کند می تواند راههای زیر را انتخاب نمایید: 

1. محقق می تواند از روش خلاصه سازی استفاده کند. در این روش داده های پرت و انتهایی به آخرین داده ی قابل قبول انتقال می یابند یعنی سر و ته داده های زده می شود و د اده های پرت به آخرین داده ی قانونی تغییر می یابند.

2. راه دوم استفاده از تکنیک های آماری است که نسبت به داده های پرت حساس نیستند مثلا استفاده از میانگین پیراسته شده(Trimmed mean) ، میانگین ویندسورنر، حداقل مجذورات پیرایش شده، حداقل میانه ی مجذورات، رگرسیون ویندسورنرو .....


دو موضوع مهم در بین موضوعات مختلف مربوط به غربالگری و تحلیل داده ها عبارتند از شناسایی و برخورد با داده های پرت و انتهایی و تحلیل داده های گمشده. اگر چه تمییز سازی داده ها شامل موضوعات دیگری مانند انتقال داده ها، اندازه ی اثر و فواصل اطمینان می شود. اما داده های موجود در این مرکز بیشتر با داده های پرت و گمشده سروکار دارند.

داده های گمشده نیز باید شناسایی شده و به طریق صحیح با آنها برخورد شود. برای پژوهشگران کاربردی لازم است تا به ماهیت داده های گمشده توجه کنند. تمام روش های سنتی برای برخورد با داده های گمشده کارایی لازم را ندارند و استفاده نمی شوند. نشان داده شده است که روش های سنتی برای براورد پارامترهای کارا و خطاهای استاندارد نا اریب کارایی لازم را ندارند. 


اعتبار و پايايي

در اين مقاله با تفصيل به مفاهيم پايايي و اعتبار پرداخته ایم . اين بررسي براي دستيابي به يک درک مناسب از چشم انداز و محدوديتهاي روشهاي ارزيابي مختلف ضروري است. در عين حال، عوامل نامربوط نظامدار يا تحريفهاي پاسخ نيز مورد بحث قرار گرفته اند. اين تحريفها که بر کاربرد شيوه هاي ارزيابي شخصيت اثر مي گذارند، مشکل کوششهاي عمدي و حتي ناهشيار را براي ايجاد يک تأثير مطلوب (يا نامطلوب) در ديگران در بر مي گيرند.

پايايي، همان طوري که از نام آن بر مي آيد، به قابليت تکرار يا اعتماد يک اندازه يا شاخص مربوط مي شود. به عنوان يک مثال بسيار ساده، مي توان گفت که ديروز ما قد يک کودک را اندازه گرفته و مقدار 122/68 سانتي متر را به دست آورده ايم. ولي امروز فرد ديگري قد همان کودک را اندازه گرفته و مقدار 122/93 سانتي متر را گزارش کرده است. اين دو مقدار تا اندازه زيادي با يکديگر هماهنگ هستند؛ يعني، ما نوعي اندازهگيري اوليه از قد کودک را در نظر گرفته ايم که در بررسي مجدد تأکيد يا تکرار شده است. اين 0/25 سانتي متر اختلاف، اين واقعيت را نشان مي دهد که تکرار اندازه گيريها تقريباً همواره تا اندازه اي ثبات يا پايايي دارد و پذيرش اين نتيجه از جانب ما نشان مي دهد که اين بي ثباتي به اندازه اي نيست که سودمندي آن را انکار کنيم. بدين ترتيب، اختلاف 0/25 سانتي متر تحت اين شرايط به اندازه اي ناچيز است که مي توان آن را بي اهميت تلقي کرد. با وجود اين، در ساير اندازه گيريهاي فيزيکي اين سطوح تحمل بسيار کم هستند، مانند سيلندر موتور که اين تفاوت، اهميت بسياري دارد و سطح بالاتري از پايايي اندازه گيري مورد نياز است.

پايايي همان دقت نيست. دقت به ميزان صحتي اشاره مي کند که اندازه گيري را بر اساس آن مي توان مشخص کرد؛ بدين ترتيب، يک شيوه اندازه گيري که به ما امکان مي دهد تا نتايج را بر اساس يک هزارم سانتي متر گزارش کنيم، دقيقتر از آن اندازه گيري است که نتايج را بر اساس يک دهم سانتي متر به دست مي دهد. درجه دقت يک ابزار مکانيکي که امکان اندازه گيري 2/432 را فراهم مي سازد، يک هزارم سانتي متر است، ولي اگر تحت شرايط يکسان اين وسيله، مقدار 2/381 سانتي متر را به دست دهد، پايايي اين اندازه گيري به هيچ وجه منطبق با دقتي نخواهد بود که اين ابزار از آن برخوردار است.

اين ويژگي که اندازه گيريها را بايد "به اندازه کافي دقيق" انجام داد، در ارزيابي شخصيت نيز کاربرد دارد. اندازه گيري شخصيت در مقايسه با اندازه گيري خصوصيات فيزيکي مانند قد، هميشه نسبتاً فاقد دقت است؛ و بنابراين، تا اندازه اي ناپاياست. بدين ترتيب، ميزان دقت يک ابزار ارزيابي شخصيت بايد با پايايي آن همخواني داشته باشد. براي کساني که از چنين ابزارهايي استفاده مي کنند معمولاً ميزان شاخص پايايي مشخص شده است. ما مجدداً در يک فرصت مناسب به موضوع پايايي باز خواهيم گشت.

اندازه گيري شخصيت داراي شکل ديگري نيز هست که در اندازه گيريهاي فيزيکي به چشم نمي خورد و آن به استانداردهاي مورد قبولي مربوط مي شود که بر اساس آنها اندازه گيريها صورت مي گيرند. هيچ ترديدي وجود ندارد که يک ياردسنج (يا يک مترسنج) براي اندازه گيري فواصل خطي مانند قد مناسب است. با وجود اين، در ارزيابي شخصيت، غالباً سؤالهايي درباره صحت و دقت ابزارهاي اندازه گيري به منظور ارزيابي بُعد يا ويژگي مورد بررسي مطرح مي شوند. براي مثال، آيا واقعاً مي توان افسردگي را با شمارش پاسخهاي رنگي به موارد بي رنگ در آزمون رورشاخ اندازه گرفت؟ در اين مورد، نه تنها سؤال مربوط به شمارش پاياي اين پاسخها مطرح است، بلکه شکل ديگر و جدي تر اين است که آيا شمارش پاسخهاي رنگ به اندازه گيري درستي از افسردگي مي انجامد، درست به همان شيوه اي که علايم مندرج ياردسنج به شاخص معتبري از قد منجر مي شود (صحت يا اعتبار ابزارهاي اندازه گيري مورد استفاده در اندازه گيريهاي فيزيکي که درجات بسيار بالايي از دقت لازم را دارد، مشکلات چندي ايجاد کرده است.)

چون پيش از آنکه بتوانيم تعيين کنيم که آيا اندازه گيري در واقع به مفهوم مورد نظر مربوط مي شود يا خير، بايد از پايايي مناسب برخوردار باشد، ابتدا به بحث درباره پايايي مي پردازيم. معيارهاي آزمون تربيتي و روان شناختي که يک راهنماي عملي براي پايايي و اعتبار است، براي چندين سال توسط انجمن روان شناسي آمريکا انتشار يافته است (براي مثال، انجمن پژوهش تربيتي آمريکا- انجمن روان شناسي آمريکا- شوراي ملي اندازه گيري در تربيت، 1985) و تمام افرادي که فعالانه در ساختن ابزارهاي اندازه گري شخصيت و کاربرد آنها شرکت دارند، بايد اين راهنما را به دقت مطالعه کنند. کتاب راهنمايي که به منظور استفاده ويژه در زمينه انتخاب استخدامي به کار مي رود و با اين کتاب راهنما قابل مقايسه است، توسط شاخه روان شناسي صنعتي- سازماني انجمن روان شناسي آمريکا (1980) منتشر شده است. در اين کتاب راهنما توجه خاصي به موارد اعتبار و پايايي و تهيه ملاکها مبذول شده است و منبع مرجع سودمندي در اين زمينه ها محسوب مي شود.

پايايي


پايايي به قابليت تکرار يا قابليت اعتماد اندازه گيري اشاره دارد. در يک موقعيت فرضي که روش اندازه گيري کاملاً پاياست، فرض مي شود که هر گونه تغييري در اندازه گيري حاصل نشان دهنده يک تغيير واقعي در صفت مورد مطالعه است. بدين ترتيب، در چنين نظامي، افزايش يک کيلوگرم در مقياس نشان خواهد داد که وزن شيء مورد نظر دقيقاً يک کيلوگرم زياد شده است؛ به همين ترتيب، افزايش نمره حاصل از يک مقياس افسردگي نشان خواهد داد که پاسخ دهنده در حال حاضر افسردگي بيشتري دارد. پايايي يک اصطلاح کلي است؛ اصطلاحهاي همساني و ثبات به ترتيب براي توصيف پايايي وابسته به ابزار و پايايي مربوط به زمان به کار مي روند.

همساني به ميزان توافقي اشاره مي کند که از به کارگيري دو يا چند ابزار اندازه گيري (يعني، مقياسها، خط کشها يا آزمونها) حاصل مي شود. هر گونه ابزار اندازه گيري يا مجموعه ابزارها را مي توان برگرفته از جامعه گسترده اي از اين ابزارها (چه واقعي يا چه فرضي) در نظر گرفت که مي توان از آنها براي اندازه گيري اين صفت خاص استفاده کرد. همساني معمولاً با به کارگيري يک آزمون يا آزمونهاي همزمان ديگر مورد ارزشيابي قرار مي گيرد که ترجيحاً به طور تصادفي از جامعه در دسترس اندازه گيريها انتخاب مي شوند. اگرچه اين موضوع در اندازه گيري ابعاد فيزيکي مانند قد يا وزن به مشکلات اندکي مي انجامد، ولي با اين حال، مشکلات چندي را در ارزيابي شخصيت ايجاد مي کند. ما به زودي اين مشکلات را مورد بررسي قرار خواهيم داد.

ثبات به دقت اندازه گيري حاصل با گذشت زمان اشاره دارد. چنانچه از ابزار ديگري براي اندازه گيري مجدد استفاده شود، بازآزمايي با گذشت زمان علاوه بر ثبات، همساني را نيز شامل مي شود. هرگاه در دو بار اندازه گيري از يک ابزار استفاده شود، ارزيابي مستقيم ثبات اندازه گيري را مي توان انجام داد. بدين ترتيب، ناتواني در رسيدن به پايايي کامل به واسطه ناهمسانيها يا خطاهايي است که تابع تغييرات حاصل در نظام مورد نظر با گذشت زمان يا تابع تغييرات مربوط به ابزار مورد نظر و يا هر دو هستند.

به طور کلي، پايايي به شواهد مختلفي اشاره مي کند که در صدد توصيف يک توافق کلي ميان عمليات اندازه گيري هستند. هر کدام از اين شواهد بر منبع معيني از عدم توافق يا خطا تأکيد مي کند و بقيه منابع را ناديده مي گيرد. اندازه گيري شخصيت شامل گرفتن نمونه اي از رفتار در يک زمان و روز معين در قبال مجموعه معيني از محرکهاست. البته اين پاسخها بايد بر طبق يک شيوه معين توسط يک آزماينده خاص ثبت شوند. بعضي از خطاهاي نمونه گيري با هر کدام از اين "موارد خاص" رابطه دارند. اين زمان خاص نمونه اي از يک دوره زماني است و اين مجموعه خاص از محرکها يا سؤالها نمونه اي از يک دسته واقعي يا فرضي از محرکها در دسترس است. بسيار اهميت دارد که بتوانيم مشخص کنيم که يک پاسخ يا نمره خاص، احتمالاً تا چه اندازه به عنوان تابعي از تغييرات در هر کدام از اين خصوصيات اندازه گيري تغيير مي کند. متأسفانه، اين نوع اطلاعات به ندرت در ارزيابي شخصيت به چشم مي خورد. 

بررسي کتاب هاي درسي در زمينه نظريه روان سنجي (براي مثال گيزلي(807)، 1964؛ نانالي(808)و برنشتاين(809)، 1994) نشان مي دهد که فرضهاي فلسفي متخصصان در زمينه مبناي اندازه گيري روان شناختي با يکديگر متفاوت است. اين تفاوتها در فلسفه به تفاوتهاي چندي در توصيف دقيق مفهوم و معناي پايايي و تفاوتهايي در شيوه هاي پيشنهادي براي اندازه گيري پايايي يک شاخص انجاميده است. در اين فصل، ما مي کوشيم تا مسير ميانه اي را از ميان رويکردهاي مختلف برگزينيم و در عين حال، علاوه بر موضوعهايي که فراتر از طيف اين کتاب قرار مي گيرند، از ناهمسانيها نيز اجتناب کنيم.

ما با اين نکته شروع مي کنيم که پايايي به طور تنگاتنگي با مفهوم خطاي اندازه گيري رابطه دارد. خطاهاي اندازه گيري را مي توان به صورت منظم يا تصادفي در نظر گرفت. هرگاه ما زمان را از روي ساعتي مشاهده کنيم که همواره پنج دقيقه جلوست، مرتکب يک خطاي منظم شده ايم. از طرف ديگر، هرگاه اين ساعت درست ولي به اندازه اي دور از ما قرار گرفته باشد که ما نتوانيم عقربه دقيقه شمار را بخوانيم، مرتکب يک خطاي تصادفي شده ايم. خطاهاي منظم را مي توان به صورت خطاهايي در نظر گرفت که با اشتباههاي معلوم رابطه دارند؛ و خطاهاي تصادفي را که به متوسط نمره درست يا مطلق گرايش دارند، مي توان زماني به صورت "موارد نامعلوم" در مشاهده در نظر گرفت که تمام خطاهاي منظم شناسايي يا حذف شده باشند.

به عبارت ديگر، خطاهاي اندازه گيري تصادفي با روش اندازه گيري "شکل مي گيرند"، درست مانند زماني که مي کوشيم با يک خط کش که تنها با اينچ مدرج شده است با تقريب يک دهم اينچ اندازه گيري کنيم يا هنگامي که سعي مي کنيم "افسردگي" را با يک پرسشنامه مداد و کاغذي کلي که فاقد ويژگيهاي باليني ضروري افسردگي است، ارزيابي کنيم. برخلاف اين خطاهاي تصادفي که اجتناب از آنها مشکل است، خطاهاي منظم مشخص تر و صحيح تر هستند. به يک معنا، خطاهاي منظم ناشي از سازنده يا استفاده کننده آزمون هستند تا اينکه به خود ابزار اندازه گيري برگردند. هرگاه ما يک مقياس افسردگي را روي آزمودنيهايي اجرا کنيم که در يک فرهنگ (يا خرده فرهنگ) متفاوت زندگي مي کنند در مقايسه با آزمودنيهايي که از هنجارهاي مناسبي برخوردارند، يا هرگاه دستورالعملهاي فشارزايي را به کار ببريم که آشکارا از دستورالعملهاي مربوط به جامعه هنجاري متفاوت باشند، در معرض خطاي منظم قرار خواهيم داشت. اين خطاهاي منظم بالقوه را مي توان و البته بايد با تنظيم هنجارهاي جديد مبتني بر گروه فرهنگي مناسب يا شرايط ديگر سنجش تصحيح کرد.

نظريه پردازان روان سنجي در کوششهاي خود براي به کميت درآوردن پايايي، به طور سنتي به مشخص کردن سهم خطاهاي تصادفي در پايايي کم پرداخته اند. عقايد آنها درباره اينکه آيا بايد خطاهاي منظم را نيز به عنوان منبع ناپايايي اندازه گيري در نظر گرفت با يکديگر اختلاف دارد، و از اين رو، ماحصل اين اختلاف عقيده در شاخص عددي پايايي انعکاس يافته است. تعدادي از شاخصهاي متداول پايايي نشان دهنده خطاي تصادفي هستند؛ و تعدادي نيز بعضي از منابع خطاي منظم و نه تمام آنها را نشان مي دهند. در نسخه تجديدنظرشده جديدتر معيارهاي سنجش تربيتي و روان شناختي (1985) با تصديق اين موضوع که روشهاي مختلف محاسبه پايايي، شامل منابع مختلف خطا هستند، توصيه شده است که پژوهشگران بايد دقيقاً روشن کنند، چه روشهايي را در به دست آوردن شاخص پايايي خاص مورد نظر به کار برده اند.

اکنون به روشهاي متداول محاسبه پايايي توجه کنيد. شاخص سنتي پايايي، ضريب پايايي است که مي توان آن را هم به عنوان همبستگي بين نمره هاي واقعي آزمون و نمره هاي "واقعي" فرضي و هم به عنوان متوسط همبستگي بين نمره هاي واقعي آزمون و ساير آزمونهاي احتمالي که همان خصوصيت را اندازه مي گيرند، در نظر گرفت. رويکردهاي عملي زير که براي محاسبه پايايي به کار مي روند، با اين تعريف شباهت دارند.

همان طوري که قبلاً اشاره کرديم، آن نوع پايايي که صرفاً با خطاي تصادفي رابطه دارد (خطاهاي ناشي از اين واقعيت که محتواي آزمون صرفاً نمونه اي از کل محتواست که ويژگي مورد نظر را در بر مي گيرد)، ثبات يا ثبات دروني آزمون ناديده مي شود. ثبات را مي توان به شيوه هاي مختلف ارزيابي کرد. يک روش، تقسيم آزمون به دو نيمه قابل مقايسه است که با يکديگر همبسته هستند. بدين ترتيب، همبستگي حاصل با استفاده از فرمولي که فرمول پيشگويي اسپيرمن - براون ناميده مي شود، با توجه به ارزش مورد انتظار براي کل آزمون "تصحيح" مي شود. چنين برآوردي از ثبات که با مقايسه ماده هاي زوج و فرد آزمون به دست مي آيد، ثبات پايايي از طريق دو نيمه کردن ناميده مي شود. روش ديگر، تعيين ثبات از طريق کاربرد نسخه هاي مشابه يا جانشين (يا موازي) آزمون است. همبستگي بين اين نسخه ها اساساً با همبستگي تصحيح شده بين دو نيمه آزمون مطابقت مي کند. هنگامي که نسخه هاي جانشين در دسترس نباشند، راه حل رايج، استفاده از روش بازآزمايي است. همبستگي بين اين دو مجموعه از نمره ها ضريب پايايي بازآزمايي ناميده مي شود.

يکي ديگر از روشهاي محاسبه پايايي که از لحاظ آماري تا اندازه اي پيچيده تر است، با استفاده از فرمول پايايي کودر- ريچاردسون صورت مي گيرد (کودر و ريچاردسون، 1937). مهمترين اجزاي اين فرمول شامل درصد ماده هاي نمره گذاري شده به شيوه اي خاص، همبستگيهاي بين ماده ها و نمره کل و انحراف معيار آزمون است. اين داده ها در فرمولي قرار مي گيرند که برآورد خوبي از ثبات را به دست مي دهد، به شرطي که آزمون مورد نظر تنها يک عامل آماري را اندازه گيري کند. متداولترين ضريب پايايي از اين دست که ضريب آلفا (کرونباخ، 1951) ناميده مي شود، "ميانگين تمام ضرايب دو نيمه سازي حاصل از نيمه هاي مختلف آزمون است (آناستازي، 1988)، قطع نظر از اينکه اين ماده ها دوارزشي يا چندارزشي هستند". دشواريهاي اين روش فراتر از دامنه اين کتاب هستند، ولي با اين حال، اين روشها در بسياري از کتابهاي درسي روان سنجي مورد بحث قرار گرفته اند.

همبستگيهاي بازآزمايي و نسخه هاي جانشين اطلاعاتي را فراتر از ثبات آزمون به دست مي دهند. چنانچه آزمودنيها در هنگام اجراي آزمون مجدد، پاسخ بعضي از ماده ها را به ياد آورند، امکان دارد که همان پاسخها را صرفاً بر اساس حافظه بدهند؛ يعني، يک اثر منظم که ممکن است به افزايش ساختگي اين همبستگي بينجامد. يا همان طوري که قبلاً بدان توجه شد، شرايط اجراي يک جلسه آزمون از يک نوبت به نوبت بعدي ممکن است تغيير کند و اين امر به منابع ناشناخته خطاي منظم مي انجامد. يا آزمودنيها ممکن است خصوصيتي را که اندازه گيري مي شود تغيير دهند، در چنين شرايطي از ميزان ضريب پايايي کاسته مي شود.

در عمل از کدام روش محاسبه ضريب پايايي بايد استفاده کرد؟ يک پاسخ ساده اين است که ضريب پايايي بايد انواع مختلف خطاهايي را که استفاده کننده آزمون به آنها علاقه مند است، انعکاس دهد. بنابراين، هرگاه ما در اندازه گيري يک مفهوم به پايايي آزمون علاقه مند باشيم، شاخص ثبات (آلفاي کرونباخ يا دو نيمه سازي) مناسب خواهد بود. چنانچه در اجراهاي مکرر و تحت شرايط مختلف به ثبات آزمون توجه نشان دهيم، آن گاه پايايي بازآزمايي يا نسخه هاي جانشين از مناسبت بيشتر برخوردار خواهند بود. در شرايط آرماني، سازنده آزمون هر دو مجموعه از داده ها را فراهم خواهد ساخت.

حدود قابل قبول ضرايب پايايي کدام اند؟ براي پاسخ به اين سؤال، ما بايد به شيوه اي توجه کنيم که بر اساس آنها، اين ضرايب را مي توان در عمل به کار برد. معمولاً، کليد اصلي به خطاي معيار اندازه گيري مربوط مي شود؛ کميتي که مستقيماً از روي ضريب پايايي و انحراف معيار نمره هاي حاصل به دست مي آيد. اگر ضريب پايايي را با r و انحراف معيار را با s نشان دهيم، خطاي معيار اندازه گيري را مي توان با توجه به فرمول sراديکال r-1 محاسبه کرد. براي نشان دادن معنا و کاربرد خطاي معيار اندازه گيري، مقياس Sc مربوط به MMPI را در نظر بگيريد. برآوردهاي ثبات دروني (ضرايب همبستگي دو نيمه آزمون) اين مقياس در حدود 0/91 گزارش شده است (دالستروم(810)، ولش(811) و دالستروم، 1975، ص 260). انحراف معيار تمام مقياسهاي MMPI براي نمره هاي مقياس بندي شده برابر با 10 است. حال خطاي معيار اندازه گيري را مي توان از فرمول ياد شده محاسبه کرد که برابر است با 10 راديکال 0/9-1 يا 3؛ يعني، مي توان گفت که هرگاه امکان اجراي اين آزمون به دفعات بسيار زياد وجود داشته باشد، متوسط نمره هاي Sc حاصل برابر با نمره هاي "واقعي" مي شود، ولي اين نمره ها با انحراف معيار 3 پيرامون اين ميانگين توزيع مي يافتند.

اگر توزيع نمره ها کاملاً نامتقارن نباشد، تقريباً دوسوم نمره ها در داخل يک انحراف معيار نسبت به ميانگين قرار مي گيرند. بنابراين، احتمال اينکه نمره حاصل از هر اجراي آزمون معين در سه واحد نسبت به نمره "واقعي" قرار گيرد، حدود دوسوم است. به عبارت ديگر، اگر يک پاسخ دهنده در مقياس Sc نمره 55 را کسب کند؛ احتمال اينکه نمره "واقعي" در سه واحد نمره 55، يعني، 52 و 58 قرار گيرد، دوسوم است. با همين استدلال، از آنجايي که حدود 95 درصد نمره هاي يکتوزيع کاملاً متقارن در دو انحراف معيار نسبت به ميانگين قرار مي گيرند، 95 درصد يا 19 مورد از 20 مورد احتمال وجود دارد که نمره واقعي پاسخ دهنده در فواصل 6 واحدي نمره 55، يعني بين 49 و 61 قرار گيرد.

همان طوري که تا اندازه اي در مورد مقياس D آزمون MMPI صادق است، فرض کنيد که مقدار اين ضريب پايايي (دو نيمه سازي) به جاي 0/91 برابر با 0/75 باشد (دالستروم، ولش و دالستروم، 1975، ص 260). با توجه به انحراف معيار 10، اين فرمول مقدار خطاي معيار اندازه گيري را برابر با 10 راديکال 0/75-1 يا 5 نشان مي دهد. اين موضوع در عمل به معناي آن است که هرگاه پاسخ دهنده اي در مقياس D نمره 60 را به دست آورده باشد، و ما بخواهيم دامنه اي را چنان تعيين کنيم که با احتمال 95 درصد نمره "واقعي" را در برگيرد، اين دامنه بايد بين 50 تا 70 باشد. هر چقدر ضريب پايايي کمتر باشد، ميزان اعتمادي را که مي توان نسبت به نمره به عنوان برآوردي از ميزان "واقعي" خصوصيتي داشت که پاسخ دهنده آن را داراست، کمتر است.

نظريه تعميم پذيري


در سال 1964، ريموند بي.کتل(812) سه روش عمده را مطرح کرد که بر اساس آنها "اثبات آزمون" را مي توان اندازه گيري کرد (البته وي اين اصطلاح کلي را بيشتر از اصطلاحهاي ديگر ترجيح مي داد). اولين روش، ثبات و توافق نمره ها در دفعات متوالي اجراست؛ يعني، تغييراتي که در يک آزمون و روي يک گروه از افراد در زمانهاي مختلف صورت مي گيرد. کتل اين ثبات را "پايايي" ناميد. دومين نوع ثبات به آزمونهاي مختلف ( يا بخشهاي يک آزمون که معمولاً ماده هاي انفرادي هستند) بر مي گردد و شامل توافق مربوط به يک بار اجراست که با استفاده از چند آزمون (يا بخشهاي آزمون) روي يک گروه از افراد صورت مي گيرد. اين ثبات "همگني" ناميده مي شود. نوع سوم ثبات به افراد مختلف بر مي گردد و شامل توافقي است که در مورد معناي نمره هاي يک آزمون که در يک زمان معين روي مجموعه هاي مختلفي از افراد اجرا شده است. اين نوع ثبات "انتقال پذيري" ( يا سرسختي) ناميده مي شود.

در يک رويکرد مشابه، کرونباخ، گليزر(813)، ناندا(814) و راجارتنام(815) (1972) فرض کردند که اساسي ترين موضوع در پايايي، سؤال مربوط به تعميم دادن مشاهده ها يا اندازه گيريها به طبقه ديگري از مشاهده هاست. بنابراين، به نظر آنها پايايي بايد به بررسي ميزاني مربوط شود که بر اساس آن، نمره هاي حاصل، معرف نمره هاي به دست آمده از شرايط ديگر يا "مجموعه هاي مرجع" مختلف است. مثالها مطالعه نمره هاي حاصل از نمره گذاران مختلف، ماده هاي آزمون، روشها، مشاهده کننده ها يا دفعات مختلف را در بر مي گيرند. همان طوري که در يک بحث دقيق درباره اين روش توسط ويگينز(1973) مورد تأکيد قرار گرفت، يکي از مزيتهاي اصلي اين روش در آن است که پژوهشگران را وا مي دارد که در خصوص مجموعه مرجع خاصي که مايل اند مشاهده هاي خودشان را بدان تعميم دهند، صريح و روشن باشند. اين امر تا اندازه اي از تمايز سنتي بين پايايي و اعتبار مي کاهد. جونز(816)، ريد(817) و پترسون(1975) در نظام کدگذاري رفتاري خودشان، مثال خوبي را در زمينه مطالعه کمّي تعميم پذيري گزارش کردند. در اين مطالعه، آزمودنيها، مشاهده کنندگان و دفعات مختلف، مجموعه هاي مرجع تعميم بودند.

پايايي و فنون فرافکن


نمره هاي کمّي حاصل از آزمونهاي فرافکن چنانچه با روشهايي که توصيف شدند ارزيابي شوند، اغلب پايايي اندکي دارند. از آنجايي که پايايي يک اندازه يا شاخص، حد بالايي را بر سودمندي بالقوه يا اعتبار آن تحميل مي کند، پاياييهاي کم اغلب در بررسيهاي پژوهشي روي اين آزمونها مسئول اعتبارهاي پايين قلمداد مي شوند. از طرف ديگر، همچنين استدلال شده است که روشهاي معمول براي ارزيابي پايايي را نمي توان براي ابزارهاي فرافکن به کار برد. براي مثال، گفته مي شود که روش دونيمه سازي براي آزمون رورشاخ نامناسب است، زيرا غيرممکن است که بتوان اين ده کارت را به گونه اي تقسيم کرد که دو نيمه قابل مقايسه را به دست دهد. پايايي بازآزمايي را نيز نمي توان به کار برد، زيرا آزمون مجدد، در واقع، يک تجربه روان شناختي متفاوت از آزمون اوليه است و چون گفته مي شود که فنون فرافکن نسبت به تغييرات جزيي در آزمودني حساس هستند، در واقع، به نظر مي رسد که در برخي از آزمونهاي فرافکن فرض مي شود که اين ابزارها کاملاً پايا هستند و اينکه تغييرات مشاهده شده در پاسخهاي آزمون با گذشت زمان مؤيد تغييرات واقعي در فرد هستند. بسياري از ويژگيهايي که اين آزمونها با آنها سرو کار دارند، مانند خُلق يا سطح انرژي با گذشت زمان تغيير مي کنند و بدين وسيله استدلال محکمي را دال بر اين مفروضه به دست مي دهند. با وجود اين، هر گونه شناخت واقعي از مشکلات پايايي اندازه گيري بايد به اين نتيجه منجر شود که بسياري از اين تغييرات، اگرچه نه همه آنها، تابعي از پايايي فرعي اين ابزارهاست. 

مشکلات اندازه گيري در ناپايايي هر آزمون تأثير دارد، ولي بعضي از مشکلات به ويژه در خصوص ابزارهاي فرافکن ايجاد مي شود. به طور کلي، مواد محرک مورد استفاده در آزمونهاي فرافکن با توجه به اينکه طبقه هاي نمره گذاري مختلف به طور مناسبي بر اساس محرکها تنظيم شوند، انتخاب نمي شوند. براي مثال، متوسط تعداد پاسخهاي حرکت (M) براي افرا غيربيمار در آزمون رورشاخ با توجه به انحراف معيارحدود 2، برابر 4 و متوسط جزئيات نادر (Dd) تنها برابر يک است (اکسنر، 1990). در عمل حداکثر پايايي اين اندازه گيريها همان طوري که نشان دادن اعتبارهاي معنادار امري تقريباً غيرممکن است، پايين است.

غالباً همان طور که در مورد آزمون TAT صادق است، نظامهاي نمره گذاري تا چند سال بعد از اينکه مواد محرک انتخاب شده باشند، تنظيم نخواهند شد. در آزمون TAT، آزمايندگان حتي در اين مورد اختيار دارند که کدام محرک را سرانجام به کار ببرند. اين رشد اتفاقي طبقه هاي نمره گذاري در ميزان پاياييهاي کم، تأثير دارد. نمره هاي نسبي (و تفاوت آنها) همان گونه که در آزمون رورشاخ به کار مي روند، به ويژه نسبت به پاياييهاي کم، حساس هستند. هولتزمن(818) در تهيه HIT، به انتخاب کارتهايي توجه کرد که در کميتهاي نمره گذاري تأثير خاصي داشتند؛ در نتيجه، پاياييهاي اکثر طبقه هاي HIT مناسبتر هستند. 

مشکل ديگر شامل استاندارد بودن دستورالعملهاست. راهنماييهاي مربوط به اجراي اکثر زبانهاي فرافکن استاندارد نشده اند، به طوري که به آزماينده امکان دهند تا به طور معناداري بر پاسخهاي آزمودني اثر گذارند. حتي اگرچه در نظام کنوني اکسنر(1986)، آزمون رورشاخ بر کاربرد ابزارهاي استاندارد شده تأکيد مي کند، آزماينده مي تواند هنوز تفاوت قايل شود. براي مثال، گراس(819) (1959) آزمون رورشاخ را روي 30 بيمار اجرا کرد، و در خصوص 20 نفر از آنها با گفتن "بسيارخوب" يا تکان دادن سر پس از هر پاسخ محتواي انسان تقويت اجتماعي را براي آنها فراهم کرد. بيماراني که بدين ترتيب تقويت شدند، در مقايسه با 10 نفر ديگر به طور معناداري پاسخهاي محتواي انسان بيشتري را ارايه دادند. اهميت اين تفاوتهاي ظريف آزماينده که ممکن است او به آنها واقف نباشد، بايد براي خواننده روشن باشد.

حتي مشکل غامضتر اين است که به آزمودنيها اغلب اجازه داده مي شود که پاسخهاي مختلف چندي بدهند که طولهاي نابرابري دارند. احتمالاً اثر محتواي روان شناختي يک پاسخ يا مجموعه پاسخهاي طولاني در مقايسه با يک پاسخ کوتاه متفاوت است. پاسخهاي کوتاه در آزمون رورشاخ يا TAT، عمدتاً مواد رايج يا پيش پا افتاده را شامل مي شوند. پراکندگي در طول پاسخ همچنين انجام مقايسه هاي آماري را بي اندازه مشکل مي کند.

مشکل ديگر در نمره گذاري تجلي مي کند. در بعضي آزمونها مانند MMPI، نمره گذاري جنبه مکانيکي دارد؛ يعني، هيچ گونه قضاوت ذهني در خصوص طبقه يک پاسخ صورت نمي گيرد يا قضاوت ذهني اندکي مورد استفاده قرار مي گيرد. همين موضوع در مورد بعضي از طبقه هاي نمره گذاري آزمونهايي مانند رورشاخ صادق است. براي مثال، هنگامي که داده ها جمع آوري مي شوند، تعيين تعداد کل پاسخهاي ارايه شده شامل هيچ قضاوتي نيست و يا قضاوت ناچيزي را در بر مي گيرد. به همين ترتيب، اندازه گيري بلندي يک شکل نقاشي يا مساحت کل آن، يک روش نسبتاً مکانيکي است. ولي با اين حال، تعيين اکثر نمره هاي حاصل از آزمونهاي فرافکن شامل چندين قضاوت ذهني است، براي مثال، آيا اين پاسخ رورشاخ شامل رنگ يا حرکت انسان است؟ آيا اين داستان TAT نياز به پيشرفت يا مهرورزي را نشان داده و يا اينکه هر دو را نشان مي دهد؟ در خصوص آن دسته از آزمونهاي فرافکن که چند روش نمره گذاري مختلف ولي مشابه را در بر مي گيرند، مشکل حتي شديدتر است.

اگرچه سؤال مربوط به پايايي نمره گذار به طور ساده يک توافق بين داوران و درون داوران است، ولي بايد به خاطر داشت که ناپايايي نمره گذاري در ناپايايي آزمون تأثير مي گذارد. مورستاين(820) (1963، ص 146-144) جدول خلاصه اي از پاياييهاي نمره گذاران را در خصوص ويژگيهاي نمره گذاري شده از آزمون TAT ارايه کرده است. از 45 مطالعه اي که پايايي تحت لواي همبستگي در آنها گزارش شده بود، ميانه پايايي نمره گذاران 0/74 به دست آمد. با پاياييهايي از اين دست، مشکلات دستيابي به سطوح قابل قبول پايايي آزمون در واقع زياد هستند. با وجود اين، مي توان در اين زمينه به پاياييهاي بالاتري نيز دست يافت. در اين خصوص، هولت(821) (1978) داده هاي TAT حاصل از چند منبع را گزارش کرد که حاکي از پايايي بالاي نمره گذاران تا سقف 0/90 بودند. دستيابي به ضرايب پايايي بالا معمولاً شامل راهنماهاي مبسوطي است که طبقه ها را با دقت تعريف کند و مثالهاي نمره گذاري را ارايه دهد. از آنجايي که کاربرد چنين راهنماهايي نيازمند توجه زياد و تلاش وافر در تعميم دادن يک نمره واحد است، آنها بيشتر به جاي قاعده يا حکم، موارد استثنايي را نشان مي دهند.

پايايي تفسير کلي


توجه بيش از حد به رويکردهاي مختلف در تعيين پايايي ممکن است از لحاظ علمي خطر از دست دادن موضوع اصلي در پايايي را به همراه داشته باشد. آزمونها فنون جمع آوري اطلاعات مربوط به شخصيت هستند و معمولاً در خصوص ارايه پيش بيني هايي درباره رفتار آتي بر مبناي عملکرد شخصيت استوارند. به همين دليل، توجه غايي ما به پايايي بايد معطوف اين باشد که کدام آزمون مطرح است؛ يعني، هرگاه آزمون رورشاخ براي به دست آوردن توصيف جامعي از عملکرد کلي شخصيت به کار رود، آن گاه موضوع اصلي، پايايي اين توصيفهاي کلي است و نه پايايي طبقه هاي نمره گذاري فردي.

در ارزيابي پاياييهاي کلي چه چيزي مورد توجه قرار دارد؟ اين روشها به روشهايي شباهت دارند که قبلاً توصيف شدند. براي مثال، پايايي حاصل از روش دو نيمه سازي را مي توان با مقايسه تفسيرهاي حاصل از بررسي نيمه هاي قابل مقايسه آزمون ارزيابي کرد؛ پايايي حاصل از روش بازآزمايي شامل مقايسه تفسيرهاي حاصل از دو اجراي مختلف آزمون است؛ و پايايي بين داوران را مي توان با مقايسه تفسيرهاي حاصل از اجراي يک آزمون که توسط داوران مختلف صورت گرفته است، تعيين کرد. پايايي بين آزمايندگان را نيز مي توان به روش مشابهي ارزيابي کرد.

براي ارايه توصيفهاي کلي شخصيت که به طور آماري مي توان به همين شيوه آنها را با يکديگر مقايسه کرد، چهارچوبهاي توصيفي چندي در خصوص شخصيت مورد نياز است. يک روش موسوم کاربرد مجموعه اي از مقياسها يا ابعاد درجه بندي است که با آزمون و نوع اطلاعات توصيفي مورد نياز متناسب هستند. بدين ترتيب، تفسير به دنبال بررسي طرح کلي آزمون، با اختصاص دادن نمره ها يا جايگاهها به آزمودنيها بر اساس اين مقياسها صورت مي گيرد. يا آزمايندگان مي توانند به تعدادي از سؤالهاي صحيح - غلط يا چندگزينه اي در خصوص موضوع پاسخ دهند. روش مرسوم ديگر، استفاده از فن دسته بندي پرسش است. يک دسته بندي پرسش معمولي شامل 100 کارت است که هر کدام يک توصيف شخصيت را در بر مي گيرد. از آزماينده خواسته مي شود که طرح کلي آزمون را مطالعه کند و بعد، عبارتهاي توصيفي را در 9 دسته طبقه بندي کند که از حداقل وصف حال تا حداکثر وصف حال آزمودني را در بر مي گيرد. تعداد کارتهايي که در هر دسته قرار مي گيرند از قبل تعيين مي شوند. به طوري که هر داور توزيع يکساني از کارتها را به دست مي دهد. در تمام اين فنون، همبستگي رتبه اي يا درصد توافق روشها را مي توان براي تعيين يک شاخص عددي پايايي به کار برد (هرگاه قصد داشته باشيم که پاياييهاي مربوط به يک آزماينده واحد را تعيين کنيم، تعداد طرحهاي آزمونهاي مورد داوري بايد به اندازه کافي زياد باشد که آزماينده نتواند به ياد آورد يا حدس بزند که کدام مورد به کدام آزمودني تعلق داشته است).

پايايي به دست آمده از هر روش ارزيابي بايد با کاربرد همان روش متناسب باشد. هرگاه پيش بيني هاي مربوط به رويدادهاي به خصوصي ارايه شود، پايايي اين پيش بيني ها بايد مورد بررسي قرار گيرد. هرگاه توصيفهاي کلي شخصيت مورد توجه باشد، اين پاياييهاي آنهاست که مورد توجه قرار مي گيرند. گرچه اغلب منابع اساسي ديگري نيز در زمينه پايايي وجود دارد (مانند پايايي نمره گذار) که پاياييهاي نهايي به آنها بستگي دارند، پايايي روش مورد استفاده، سؤال مربوط به علاقه نهايي است.

پي نوشت:


807- Ghiselli

808- Nunnally

809- Bernstein

810- Dahlstrom

811- Welsh

812- Raymond B. Cattell

813- Gleser

814- Nanda

815- Rajaratnam

816- Jones

817- Reid

818- Holtzman

819- Gross

820- Murstein

821- Holt


منبع:تالیف:آی . لانیون،ریچارد و دی فلئونارد ، ترجمه:نقشبندی،سیامک و .... «ارزيابي شخصيت» ، نشر روان ،1385

اعتبار و پايايي

در اين مقاله با تفصيل به مفاهيم پايايي و اعتبار پرداخته ایم . اين بررسي براي دستيابي به يک درک مناسب از چشم انداز و محدوديتهاي روشهاي ارزيابي مختلف ضروري است. در عين حال، عوامل نامربوط نظامدار يا تحريفهاي پاسخ نيز مورد بحث قرار گرفته اند. اين تحريفها که بر کاربرد شيوه هاي ارزيابي شخصيت اثر مي گذارند، مشکل کوششهاي عمدي و حتي ناهشيار را براي ايجاد يک تأثير مطلوب (يا نامطلوب) در ديگران در بر مي گيرند.

پايايي، همان طوري که از نام آن بر مي آيد، به قابليت تکرار يا اعتماد يک اندازه يا شاخص مربوط مي شود. به عنوان يک مثال بسيار ساده، مي توان گفت که ديروز ما قد يک کودک را اندازه گرفته و مقدار 122/68 سانتي متر را به دست آورده ايم. ولي امروز فرد ديگري قد همان کودک را اندازه گرفته و مقدار 122/93 سانتي متر را گزارش کرده است. اين دو مقدار تا اندازه زيادي با يکديگر هماهنگ هستند؛ يعني، ما نوعي اندازهگيري اوليه از قد کودک را در نظر گرفته ايم که در بررسي مجدد تأکيد يا تکرار شده است. اين 0/25 سانتي متر اختلاف، اين واقعيت را نشان مي دهد که تکرار اندازه گيريها تقريباً همواره تا اندازه اي ثبات يا پايايي دارد و پذيرش اين نتيجه از جانب ما نشان مي دهد که اين بي ثباتي به اندازه اي نيست که سودمندي آن را انکار کنيم. بدين ترتيب، اختلاف 0/25 سانتي متر تحت اين شرايط به اندازه اي ناچيز است که مي توان آن را بي اهميت تلقي کرد. با وجود اين، در ساير اندازه گيريهاي فيزيکي اين سطوح تحمل بسيار کم هستند، مانند سيلندر موتور که اين تفاوت، اهميت بسياري دارد و سطح بالاتري از پايايي اندازه گيري مورد نياز است.

پايايي همان دقت نيست. دقت به ميزان صحتي اشاره مي کند که اندازه گيري را بر اساس آن مي توان مشخص کرد؛ بدين ترتيب، يک شيوه اندازه گيري که به ما امکان مي دهد تا نتايج را بر اساس يک هزارم سانتي متر گزارش کنيم، دقيقتر از آن اندازه گيري است که نتايج را بر اساس يک دهم سانتي متر به دست مي دهد. درجه دقت يک ابزار مکانيکي که امکان اندازه گيري 2/432 را فراهم مي سازد، يک هزارم سانتي متر است، ولي اگر تحت شرايط يکسان اين وسيله، مقدار 2/381 سانتي متر را به دست دهد، پايايي اين اندازه گيري به هيچ وجه منطبق با دقتي نخواهد بود که اين ابزار از آن برخوردار است.

اين ويژگي که اندازه گيريها را بايد "به اندازه کافي دقيق" انجام داد، در ارزيابي شخصيت نيز کاربرد دارد. اندازه گيري شخصيت در مقايسه با اندازه گيري خصوصيات فيزيکي مانند قد، هميشه نسبتاً فاقد دقت است؛ و بنابراين، تا اندازه اي ناپاياست. بدين ترتيب، ميزان دقت يک ابزار ارزيابي شخصيت بايد با پايايي آن همخواني داشته باشد. براي کساني که از چنين ابزارهايي استفاده مي کنند معمولاً ميزان شاخص پايايي مشخص شده است. ما مجدداً در يک فرصت مناسب به موضوع پايايي باز خواهيم گشت.

اندازه گيري شخصيت داراي شکل ديگري نيز هست که در اندازه گيريهاي فيزيکي به چشم نمي خورد و آن به استانداردهاي مورد قبولي مربوط مي شود که بر اساس آنها اندازه گيريها صورت مي گيرند. هيچ ترديدي وجود ندارد که يک ياردسنج (يا يک مترسنج) براي اندازه گيري فواصل خطي مانند قد مناسب است. با وجود اين، در ارزيابي شخصيت، غالباً سؤالهايي درباره صحت و دقت ابزارهاي اندازه گيري به منظور ارزيابي بُعد يا ويژگي مورد بررسي مطرح مي شوند. براي مثال، آيا واقعاً مي توان افسردگي را با شمارش پاسخهاي رنگي به موارد بي رنگ در آزمون رورشاخ اندازه گرفت؟ در اين مورد، نه تنها سؤال مربوط به شمارش پاياي اين پاسخها مطرح است، بلکه شکل ديگر و جدي تر اين است که آيا شمارش پاسخهاي رنگ به اندازه گيري درستي از افسردگي مي انجامد، درست به همان شيوه اي که علايم مندرج ياردسنج به شاخص معتبري از قد منجر مي شود (صحت يا اعتبار ابزارهاي اندازه گيري مورد استفاده در اندازه گيريهاي فيزيکي که درجات بسيار بالايي از دقت لازم را دارد، مشکلات چندي ايجاد کرده است.)

چون پيش از آنکه بتوانيم تعيين کنيم که آيا اندازه گيري در واقع به مفهوم مورد نظر مربوط مي شود يا خير، بايد از پايايي مناسب برخوردار باشد، ابتدا به بحث درباره پايايي مي پردازيم. معيارهاي آزمون تربيتي و روان شناختي که يک راهنماي عملي براي پايايي و اعتبار است، براي چندين سال توسط انجمن روان شناسي آمريکا انتشار يافته است (براي مثال، انجمن پژوهش تربيتي آمريکا- انجمن روان شناسي آمريکا- شوراي ملي اندازه گيري در تربيت، 1985) و تمام افرادي که فعالانه در ساختن ابزارهاي اندازه گري شخصيت و کاربرد آنها شرکت دارند، بايد اين راهنما را به دقت مطالعه کنند. کتاب راهنمايي که به منظور استفاده ويژه در زمينه انتخاب استخدامي به کار مي رود و با اين کتاب راهنما قابل مقايسه است، توسط شاخه روان شناسي صنعتي- سازماني انجمن روان شناسي آمريکا (1980) منتشر شده است. در اين کتاب راهنما توجه خاصي به موارد اعتبار و پايايي و تهيه ملاکها مبذول شده است و منبع مرجع سودمندي در اين زمينه ها محسوب مي شود.

پايايي


پايايي به قابليت تکرار يا قابليت اعتماد اندازه گيري اشاره دارد. در يک موقعيت فرضي که روش اندازه گيري کاملاً پاياست، فرض مي شود که هر گونه تغييري در اندازه گيري حاصل نشان دهنده يک تغيير واقعي در صفت مورد مطالعه است. بدين ترتيب، در چنين نظامي، افزايش يک کيلوگرم در مقياس نشان خواهد داد که وزن شيء مورد نظر دقيقاً يک کيلوگرم زياد شده است؛ به همين ترتيب، افزايش نمره حاصل از يک مقياس افسردگي نشان خواهد داد که پاسخ دهنده در حال حاضر افسردگي بيشتري دارد. پايايي يک اصطلاح کلي است؛ اصطلاحهاي همساني و ثبات به ترتيب براي توصيف پايايي وابسته به ابزار و پايايي مربوط به زمان به کار مي روند.

همساني به ميزان توافقي اشاره مي کند که از به کارگيري دو يا چند ابزار اندازه گيري (يعني، مقياسها، خط کشها يا آزمونها) حاصل مي شود. هر گونه ابزار اندازه گيري يا مجموعه ابزارها را مي توان برگرفته از جامعه گسترده اي از اين ابزارها (چه واقعي يا چه فرضي) در نظر گرفت که مي توان از آنها براي اندازه گيري اين صفت خاص استفاده کرد. همساني معمولاً با به کارگيري يک آزمون يا آزمونهاي همزمان ديگر مورد ارزشيابي قرار مي گيرد که ترجيحاً به طور تصادفي از جامعه در دسترس اندازه گيريها انتخاب مي شوند. اگرچه اين موضوع در اندازه گيري ابعاد فيزيکي مانند قد يا وزن به مشکلات اندکي مي انجامد، ولي با اين حال، مشکلات چندي را در ارزيابي شخصيت ايجاد مي کند. ما به زودي اين مشکلات را مورد بررسي قرار خواهيم داد.

ثبات به دقت اندازه گيري حاصل با گذشت زمان اشاره دارد. چنانچه از ابزار ديگري براي اندازه گيري مجدد استفاده شود، بازآزمايي با گذشت زمان علاوه بر ثبات، همساني را نيز شامل مي شود. هرگاه در دو بار اندازه گيري از يک ابزار استفاده شود، ارزيابي مستقيم ثبات اندازه گيري را مي توان انجام داد. بدين ترتيب، ناتواني در رسيدن به پايايي کامل به واسطه ناهمسانيها يا خطاهايي است که تابع تغييرات حاصل در نظام مورد نظر با گذشت زمان يا تابع تغييرات مربوط به ابزار مورد نظر و يا هر دو هستند.

به طور کلي، پايايي به شواهد مختلفي اشاره مي کند که در صدد توصيف يک توافق کلي ميان عمليات اندازه گيري هستند. هر کدام از اين شواهد بر منبع معيني از عدم توافق يا خطا تأکيد مي کند و بقيه منابع را ناديده مي گيرد. اندازه گيري شخصيت شامل گرفتن نمونه اي از رفتار در يک زمان و روز معين در قبال مجموعه معيني از محرکهاست. البته اين پاسخها بايد بر طبق يک شيوه معين توسط يک آزماينده خاص ثبت شوند. بعضي از خطاهاي نمونه گيري با هر کدام از اين "موارد خاص" رابطه دارند. اين زمان خاص نمونه اي از يک دوره زماني است و اين مجموعه خاص از محرکها يا سؤالها نمونه اي از يک دسته واقعي يا فرضي از محرکها در دسترس است. بسيار اهميت دارد که بتوانيم مشخص کنيم که يک پاسخ يا نمره خاص، احتمالاً تا چه اندازه به عنوان تابعي از تغييرات در هر کدام از اين خصوصيات اندازه گيري تغيير مي کند. متأسفانه، اين نوع اطلاعات به ندرت در ارزيابي شخصيت به چشم مي خورد. 

بررسي کتاب هاي درسي در زمينه نظريه روان سنجي (براي مثال گيزلي(807)، 1964؛ نانالي(808)و برنشتاين(809)، 1994) نشان مي دهد که فرضهاي فلسفي متخصصان در زمينه مبناي اندازه گيري روان شناختي با يکديگر متفاوت است. اين تفاوتها در فلسفه به تفاوتهاي چندي در توصيف دقيق مفهوم و معناي پايايي و تفاوتهايي در شيوه هاي پيشنهادي براي اندازه گيري پايايي يک شاخص انجاميده است. در اين فصل، ما مي کوشيم تا مسير ميانه اي را از ميان رويکردهاي مختلف برگزينيم و در عين حال، علاوه بر موضوعهايي که فراتر از طيف اين کتاب قرار مي گيرند، از ناهمسانيها نيز اجتناب کنيم.

ما با اين نکته شروع مي کنيم که پايايي به طور تنگاتنگي با مفهوم خطاي اندازه گيري رابطه دارد. خطاهاي اندازه گيري را مي توان به صورت منظم يا تصادفي در نظر گرفت. هرگاه ما زمان را از روي ساعتي مشاهده کنيم که همواره پنج دقيقه جلوست، مرتکب يک خطاي منظم شده ايم. از طرف ديگر، هرگاه اين ساعت درست ولي به اندازه اي دور از ما قرار گرفته باشد که ما نتوانيم عقربه دقيقه شمار را بخوانيم، مرتکب يک خطاي تصادفي شده ايم. خطاهاي منظم را مي توان به صورت خطاهايي در نظر گرفت که با اشتباههاي معلوم رابطه دارند؛ و خطاهاي تصادفي را که به متوسط نمره درست يا مطلق گرايش دارند، مي توان زماني به صورت "موارد نامعلوم" در مشاهده در نظر گرفت که تمام خطاهاي منظم شناسايي يا حذف شده باشند.

به عبارت ديگر، خطاهاي اندازه گيري تصادفي با روش اندازه گيري "شکل مي گيرند"، درست مانند زماني که مي کوشيم با يک خط کش که تنها با اينچ مدرج شده است با تقريب يک دهم اينچ اندازه گيري کنيم يا هنگامي که سعي مي کنيم "افسردگي" را با يک پرسشنامه مداد و کاغذي کلي که فاقد ويژگيهاي باليني ضروري افسردگي است، ارزيابي کنيم. برخلاف اين خطاهاي تصادفي که اجتناب از آنها مشکل است، خطاهاي منظم مشخص تر و صحيح تر هستند. به يک معنا، خطاهاي منظم ناشي از سازنده يا استفاده کننده آزمون هستند تا اينکه به خود ابزار اندازه گيري برگردند. هرگاه ما يک مقياس افسردگي را روي آزمودنيهايي اجرا کنيم که در يک فرهنگ (يا خرده فرهنگ) متفاوت زندگي مي کنند در مقايسه با آزمودنيهايي که از هنجارهاي مناسبي برخوردارند، يا هرگاه دستورالعملهاي فشارزايي را به کار ببريم که آشکارا از دستورالعملهاي مربوط به جامعه هنجاري متفاوت باشند، در معرض خطاي منظم قرار خواهيم داشت. اين خطاهاي منظم بالقوه را مي توان و البته بايد با تنظيم هنجارهاي جديد مبتني بر گروه فرهنگي مناسب يا شرايط ديگر سنجش تصحيح کرد.

نظريه پردازان روان سنجي در کوششهاي خود براي به کميت درآوردن پايايي، به طور سنتي به مشخص کردن سهم خطاهاي تصادفي در پايايي کم پرداخته اند. عقايد آنها درباره اينکه آيا بايد خطاهاي منظم را نيز به عنوان منبع ناپايايي اندازه گيري در نظر گرفت با يکديگر اختلاف دارد، و از اين رو، ماحصل اين اختلاف عقيده در شاخص عددي پايايي انعکاس يافته است. تعدادي از شاخصهاي متداول پايايي نشان دهنده خطاي تصادفي هستند؛ و تعدادي نيز بعضي از منابع خطاي منظم و نه تمام آنها را نشان مي دهند. در نسخه تجديدنظرشده جديدتر معيارهاي سنجش تربيتي و روان شناختي (1985) با تصديق اين موضوع که روشهاي مختلف محاسبه پايايي، شامل منابع مختلف خطا هستند، توصيه شده است که پژوهشگران بايد دقيقاً روشن کنند، چه روشهايي را در به دست آوردن شاخص پايايي خاص مورد نظر به کار برده اند.

اکنون به روشهاي متداول محاسبه پايايي توجه کنيد. شاخص سنتي پايايي، ضريب پايايي است که مي توان آن را هم به عنوان همبستگي بين نمره هاي واقعي آزمون و نمره هاي "واقعي" فرضي و هم به عنوان متوسط همبستگي بين نمره هاي واقعي آزمون و ساير آزمونهاي احتمالي که همان خصوصيت را اندازه مي گيرند، در نظر گرفت. رويکردهاي عملي زير که براي محاسبه پايايي به کار مي روند، با اين تعريف شباهت دارند.

همان طوري که قبلاً اشاره کرديم، آن نوع پايايي که صرفاً با خطاي تصادفي رابطه دارد (خطاهاي ناشي از اين واقعيت که محتواي آزمون صرفاً نمونه اي از کل محتواست که ويژگي مورد نظر را در بر مي گيرد)، ثبات يا ثبات دروني آزمون ناديده مي شود. ثبات را مي توان به شيوه هاي مختلف ارزيابي کرد. يک روش، تقسيم آزمون به دو نيمه قابل مقايسه است که با يکديگر همبسته هستند. بدين ترتيب، همبستگي حاصل با استفاده از فرمولي که فرمول پيشگويي اسپيرمن - براون ناميده مي شود، با توجه به ارزش مورد انتظار براي کل آزمون "تصحيح" مي شود. چنين برآوردي از ثبات که با مقايسه ماده هاي زوج و فرد آزمون به دست مي آيد، ثبات پايايي از طريق دو نيمه کردن ناميده مي شود. روش ديگر، تعيين ثبات از طريق کاربرد نسخه هاي مشابه يا جانشين (يا موازي) آزمون است. همبستگي بين اين نسخه ها اساساً با همبستگي تصحيح شده بين دو نيمه آزمون مطابقت مي کند. هنگامي که نسخه هاي جانشين در دسترس نباشند، راه حل رايج، استفاده از روش بازآزمايي است. همبستگي بين اين دو مجموعه از نمره ها ضريب پايايي بازآزمايي ناميده مي شود.

يکي ديگر از روشهاي محاسبه پايايي که از لحاظ آماري تا اندازه اي پيچيده تر است، با استفاده از فرمول پايايي کودر- ريچاردسون صورت مي گيرد (کودر و ريچاردسون، 1937). مهمترين اجزاي اين فرمول شامل درصد ماده هاي نمره گذاري شده به شيوه اي خاص، همبستگيهاي بين ماده ها و نمره کل و انحراف معيار آزمون است. اين داده ها در فرمولي قرار مي گيرند که برآورد خوبي از ثبات را به دست مي دهد، به شرطي که آزمون مورد نظر تنها يک عامل آماري را اندازه گيري کند. متداولترين ضريب پايايي از اين دست که ضريب آلفا (کرونباخ، 1951) ناميده مي شود، "ميانگين تمام ضرايب دو نيمه سازي حاصل از نيمه هاي مختلف آزمون است (آناستازي، 1988)، قطع نظر از اينکه اين ماده ها دوارزشي يا چندارزشي هستند". دشواريهاي اين روش فراتر از دامنه اين کتاب هستند، ولي با اين حال، اين روشها در بسياري از کتابهاي درسي روان سنجي مورد بحث قرار گرفته اند.

همبستگيهاي بازآزمايي و نسخه هاي جانشين اطلاعاتي را فراتر از ثبات آزمون به دست مي دهند. چنانچه آزمودنيها در هنگام اجراي آزمون مجدد، پاسخ بعضي از ماده ها را به ياد آورند، امکان دارد که همان پاسخها را صرفاً بر اساس حافظه بدهند؛ يعني، يک اثر منظم که ممکن است به افزايش ساختگي اين همبستگي بينجامد. يا همان طوري که قبلاً بدان توجه شد، شرايط اجراي يک جلسه آزمون از يک نوبت به نوبت بعدي ممکن است تغيير کند و اين امر به منابع ناشناخته خطاي منظم مي انجامد. يا آزمودنيها ممکن است خصوصيتي را که اندازه گيري مي شود تغيير دهند، در چنين شرايطي از ميزان ضريب پايايي کاسته مي شود.

در عمل از کدام روش محاسبه ضريب پايايي بايد استفاده کرد؟ يک پاسخ ساده اين است که ضريب پايايي بايد انواع مختلف خطاهايي را که استفاده کننده آزمون به آنها علاقه مند است، انعکاس دهد. بنابراين، هرگاه ما در اندازه گيري يک مفهوم به پايايي آزمون علاقه مند باشيم، شاخص ثبات (آلفاي کرونباخ يا دو نيمه سازي) مناسب خواهد بود. چنانچه در اجراهاي مکرر و تحت شرايط مختلف به ثبات آزمون توجه نشان دهيم، آن گاه پايايي بازآزمايي يا نسخه هاي جانشين از مناسبت بيشتر برخوردار خواهند بود. در شرايط آرماني، سازنده آزمون هر دو مجموعه از داده ها را فراهم خواهد ساخت.

حدود قابل قبول ضرايب پايايي کدام اند؟ براي پاسخ به اين سؤال، ما بايد به شيوه اي توجه کنيم که بر اساس آنها، اين ضرايب را مي توان در عمل به کار برد. معمولاً، کليد اصلي به خطاي معيار اندازه گيري مربوط مي شود؛ کميتي که مستقيماً از روي ضريب پايايي و انحراف معيار نمره هاي حاصل به دست مي آيد. اگر ضريب پايايي را با r و انحراف معيار را با s نشان دهيم، خطاي معيار اندازه گيري را مي توان با توجه به فرمول sراديکال r-1 محاسبه کرد. براي نشان دادن معنا و کاربرد خطاي معيار اندازه گيري، مقياس Sc مربوط به MMPI را در نظر بگيريد. برآوردهاي ثبات دروني (ضرايب همبستگي دو نيمه آزمون) اين مقياس در حدود 0/91 گزارش شده است (دالستروم(810)، ولش(811) و دالستروم، 1975، ص 260). انحراف معيار تمام مقياسهاي MMPI براي نمره هاي مقياس بندي شده برابر با 10 است. حال خطاي معيار اندازه گيري را مي توان از فرمول ياد شده محاسبه کرد که برابر است با 10 راديکال 0/9-1 يا 3؛ يعني، مي توان گفت که هرگاه امکان اجراي اين آزمون به دفعات بسيار زياد وجود داشته باشد، متوسط نمره هاي Sc حاصل برابر با نمره هاي "واقعي" مي شود، ولي اين نمره ها با انحراف معيار 3 پيرامون اين ميانگين توزيع مي يافتند.

اگر توزيع نمره ها کاملاً نامتقارن نباشد، تقريباً دوسوم نمره ها در داخل يک انحراف معيار نسبت به ميانگين قرار مي گيرند. بنابراين، احتمال اينکه نمره حاصل از هر اجراي آزمون معين در سه واحد نسبت به نمره "واقعي" قرار گيرد، حدود دوسوم است. به عبارت ديگر، اگر يک پاسخ دهنده در مقياس Sc نمره 55 را کسب کند؛ احتمال اينکه نمره "واقعي" در سه واحد نمره 55، يعني، 52 و 58 قرار گيرد، دوسوم است. با همين استدلال، از آنجايي که حدود 95 درصد نمره هاي يکتوزيع کاملاً متقارن در دو انحراف معيار نسبت به ميانگين قرار مي گيرند، 95 درصد يا 19 مورد از 20 مورد احتمال وجود دارد که نمره واقعي پاسخ دهنده در فواصل 6 واحدي نمره 55، يعني بين 49 و 61 قرار گيرد.

همان طوري که تا اندازه اي در مورد مقياس D آزمون MMPI صادق است، فرض کنيد که مقدار اين ضريب پايايي (دو نيمه سازي) به جاي 0/91 برابر با 0/75 باشد (دالستروم، ولش و دالستروم، 1975، ص 260). با توجه به انحراف معيار 10، اين فرمول مقدار خطاي معيار اندازه گيري را برابر با 10 راديکال 0/75-1 يا 5 نشان مي دهد. اين موضوع در عمل به معناي آن است که هرگاه پاسخ دهنده اي در مقياس D نمره 60 را به دست آورده باشد، و ما بخواهيم دامنه اي را چنان تعيين کنيم که با احتمال 95 درصد نمره "واقعي" را در برگيرد، اين دامنه بايد بين 50 تا 70 باشد. هر چقدر ضريب پايايي کمتر باشد، ميزان اعتمادي را که مي توان نسبت به نمره به عنوان برآوردي از ميزان "واقعي" خصوصيتي داشت که پاسخ دهنده آن را داراست، کمتر است.

نظريه تعميم پذيري


در سال 1964، ريموند بي.کتل(812) سه روش عمده را مطرح کرد که بر اساس آنها "اثبات آزمون" را مي توان اندازه گيري کرد (البته وي اين اصطلاح کلي را بيشتر از اصطلاحهاي ديگر ترجيح مي داد). اولين روش، ثبات و توافق نمره ها در دفعات متوالي اجراست؛ يعني، تغييراتي که در يک آزمون و روي يک گروه از افراد در زمانهاي مختلف صورت مي گيرد. کتل اين ثبات را "پايايي" ناميد. دومين نوع ثبات به آزمونهاي مختلف ( يا بخشهاي يک آزمون که معمولاً ماده هاي انفرادي هستند) بر مي گردد و شامل توافق مربوط به يک بار اجراست که با استفاده از چند آزمون (يا بخشهاي آزمون) روي يک گروه از افراد صورت مي گيرد. اين ثبات "همگني" ناميده مي شود. نوع سوم ثبات به افراد مختلف بر مي گردد و شامل توافقي است که در مورد معناي نمره هاي يک آزمون که در يک زمان معين روي مجموعه هاي مختلفي از افراد اجرا شده است. اين نوع ثبات "انتقال پذيري" ( يا سرسختي) ناميده مي شود.

در يک رويکرد مشابه، کرونباخ، گليزر(813)، ناندا(814) و راجارتنام(815) (1972) فرض کردند که اساسي ترين موضوع در پايايي، سؤال مربوط به تعميم دادن مشاهده ها يا اندازه گيريها به طبقه ديگري از مشاهده هاست. بنابراين، به نظر آنها پايايي بايد به بررسي ميزاني مربوط شود که بر اساس آن، نمره هاي حاصل، معرف نمره هاي به دست آمده از شرايط ديگر يا "مجموعه هاي مرجع" مختلف است. مثالها مطالعه نمره هاي حاصل از نمره گذاران مختلف، ماده هاي آزمون، روشها، مشاهده کننده ها يا دفعات مختلف را در بر مي گيرند. همان طوري که در يک بحث دقيق درباره اين روش توسط ويگينز(1973) مورد تأکيد قرار گرفت، يکي از مزيتهاي اصلي اين روش در آن است که پژوهشگران را وا مي دارد که در خصوص مجموعه مرجع خاصي که مايل اند مشاهده هاي خودشان را بدان تعميم دهند، صريح و روشن باشند. اين امر تا اندازه اي از تمايز سنتي بين پايايي و اعتبار مي کاهد. جونز(816)، ريد(817) و پترسون(1975) در نظام کدگذاري رفتاري خودشان، مثال خوبي را در زمينه مطالعه کمّي تعميم پذيري گزارش کردند. در اين مطالعه، آزمودنيها، مشاهده کنندگان و دفعات مختلف، مجموعه هاي مرجع تعميم بودند.

پايايي و فنون فرافکن


نمره هاي کمّي حاصل از آزمونهاي فرافکن چنانچه با روشهايي که توصيف شدند ارزيابي شوند، اغلب پايايي اندکي دارند. از آنجايي که پايايي يک اندازه يا شاخص، حد بالايي را بر سودمندي بالقوه يا اعتبار آن تحميل مي کند، پاياييهاي کم اغلب در بررسيهاي پژوهشي روي اين آزمونها مسئول اعتبارهاي پايين قلمداد مي شوند. از طرف ديگر، همچنين استدلال شده است که روشهاي معمول براي ارزيابي پايايي را نمي توان براي ابزارهاي فرافکن به کار برد. براي مثال، گفته مي شود که روش دونيمه سازي براي آزمون رورشاخ نامناسب است، زيرا غيرممکن است که بتوان اين ده کارت را به گونه اي تقسيم کرد که دو نيمه قابل مقايسه را به دست دهد. پايايي بازآزمايي را نيز نمي توان به کار برد، زيرا آزمون مجدد، در واقع، يک تجربه روان شناختي متفاوت از آزمون اوليه است و چون گفته مي شود که فنون فرافکن نسبت به تغييرات جزيي در آزمودني حساس هستند، در واقع، به نظر مي رسد که در برخي از آزمونهاي فرافکن فرض مي شود که اين ابزارها کاملاً پايا هستند و اينکه تغييرات مشاهده شده در پاسخهاي آزمون با گذشت زمان مؤيد تغييرات واقعي در فرد هستند. بسياري از ويژگيهايي که اين آزمونها با آنها سرو کار دارند، مانند خُلق يا سطح انرژي با گذشت زمان تغيير مي کنند و بدين وسيله استدلال محکمي را دال بر اين مفروضه به دست مي دهند. با وجود اين، هر گونه شناخت واقعي از مشکلات پايايي اندازه گيري بايد به اين نتيجه منجر شود که بسياري از اين تغييرات، اگرچه نه همه آنها، تابعي از پايايي فرعي اين ابزارهاست. 

مشکلات اندازه گيري در ناپايايي هر آزمون تأثير دارد، ولي بعضي از مشکلات به ويژه در خصوص ابزارهاي فرافکن ايجاد مي شود. به طور کلي، مواد محرک مورد استفاده در آزمونهاي فرافکن با توجه به اينکه طبقه هاي نمره گذاري مختلف به طور مناسبي بر اساس محرکها تنظيم شوند، انتخاب نمي شوند. براي مثال، متوسط تعداد پاسخهاي حرکت (M) براي افرا غيربيمار در آزمون رورشاخ با توجه به انحراف معيارحدود 2، برابر 4 و متوسط جزئيات نادر (Dd) تنها برابر يک است (اکسنر، 1990). در عمل حداکثر پايايي اين اندازه گيريها همان طوري که نشان دادن اعتبارهاي معنادار امري تقريباً غيرممکن است، پايين است.

غالباً همان طور که در مورد آزمون TAT صادق است، نظامهاي نمره گذاري تا چند سال بعد از اينکه مواد محرک انتخاب شده باشند، تنظيم نخواهند شد. در آزمون TAT، آزمايندگان حتي در اين مورد اختيار دارند که کدام محرک را سرانجام به کار ببرند. اين رشد اتفاقي طبقه هاي نمره گذاري در ميزان پاياييهاي کم، تأثير دارد. نمره هاي نسبي (و تفاوت آنها) همان گونه که در آزمون رورشاخ به کار مي روند، به ويژه نسبت به پاياييهاي کم، حساس هستند. هولتزمن(818) در تهيه HIT، به انتخاب کارتهايي توجه کرد که در کميتهاي نمره گذاري تأثير خاصي داشتند؛ در نتيجه، پاياييهاي اکثر طبقه هاي HIT مناسبتر هستند. 

مشکل ديگر شامل استاندارد بودن دستورالعملهاست. راهنماييهاي مربوط به اجراي اکثر زبانهاي فرافکن استاندارد نشده اند، به طوري که به آزماينده امکان دهند تا به طور معناداري بر پاسخهاي آزمودني اثر گذارند. حتي اگرچه در نظام کنوني اکسنر(1986)، آزمون رورشاخ بر کاربرد ابزارهاي استاندارد شده تأکيد مي کند، آزماينده مي تواند هنوز تفاوت قايل شود. براي مثال، گراس(819) (1959) آزمون رورشاخ را روي 30 بيمار اجرا کرد، و در خصوص 20 نفر از آنها با گفتن "بسيارخوب" يا تکان دادن سر پس از هر پاسخ محتواي انسان تقويت اجتماعي را براي آنها فراهم کرد. بيماراني که بدين ترتيب تقويت شدند، در مقايسه با 10 نفر ديگر به طور معناداري پاسخهاي محتواي انسان بيشتري را ارايه دادند. اهميت اين تفاوتهاي ظريف آزماينده که ممکن است او به آنها واقف نباشد، بايد براي خواننده روشن باشد.

حتي مشکل غامضتر اين است که به آزمودنيها اغلب اجازه داده مي شود که پاسخهاي مختلف چندي بدهند که طولهاي نابرابري دارند. احتمالاً اثر محتواي روان شناختي يک پاسخ يا مجموعه پاسخهاي طولاني در مقايسه با يک پاسخ کوتاه متفاوت است. پاسخهاي کوتاه در آزمون رورشاخ يا TAT، عمدتاً مواد رايج يا پيش پا افتاده را شامل مي شوند. پراکندگي در طول پاسخ همچنين انجام مقايسه هاي آماري را بي اندازه مشکل مي کند.

مشکل ديگر در نمره گذاري تجلي مي کند. در بعضي آزمونها مانند MMPI، نمره گذاري جنبه مکانيکي دارد؛ يعني، هيچ گونه قضاوت ذهني در خصوص طبقه يک پاسخ صورت نمي گيرد يا قضاوت ذهني اندکي مورد استفاده قرار مي گيرد. همين موضوع در مورد بعضي از طبقه هاي نمره گذاري آزمونهايي مانند رورشاخ صادق است. براي مثال، هنگامي که داده ها جمع آوري مي شوند، تعيين تعداد کل پاسخهاي ارايه شده شامل هيچ قضاوتي نيست و يا قضاوت ناچيزي را در بر مي گيرد. به همين ترتيب، اندازه گيري بلندي يک شکل نقاشي يا مساحت کل آن، يک روش نسبتاً مکانيکي است. ولي با اين حال، تعيين اکثر نمره هاي حاصل از آزمونهاي فرافکن شامل چندين قضاوت ذهني است، براي مثال، آيا اين پاسخ رورشاخ شامل رنگ يا حرکت انسان است؟ آيا اين داستان TAT نياز به پيشرفت يا مهرورزي را نشان داده و يا اينکه هر دو را نشان مي دهد؟ در خصوص آن دسته از آزمونهاي فرافکن که چند روش نمره گذاري مختلف ولي مشابه را در بر مي گيرند، مشکل حتي شديدتر است.

اگرچه سؤال مربوط به پايايي نمره گذار به طور ساده يک توافق بين داوران و درون داوران است، ولي بايد به خاطر داشت که ناپايايي نمره گذاري در ناپايايي آزمون تأثير مي گذارد. مورستاين(820) (1963، ص 146-144) جدول خلاصه اي از پاياييهاي نمره گذاران را در خصوص ويژگيهاي نمره گذاري شده از آزمون TAT ارايه کرده است. از 45 مطالعه اي که پايايي تحت لواي همبستگي در آنها گزارش شده بود، ميانه پايايي نمره گذاران 0/74 به دست آمد. با پاياييهايي از اين دست، مشکلات دستيابي به سطوح قابل قبول پايايي آزمون در واقع زياد هستند. با وجود اين، مي توان در اين زمينه به پاياييهاي بالاتري نيز دست يافت. در اين خصوص، هولت(821) (1978) داده هاي TAT حاصل از چند منبع را گزارش کرد که حاکي از پايايي بالاي نمره گذاران تا سقف 0/90 بودند. دستيابي به ضرايب پايايي بالا معمولاً شامل راهنماهاي مبسوطي است که طبقه ها را با دقت تعريف کند و مثالهاي نمره گذاري را ارايه دهد. از آنجايي که کاربرد چنين راهنماهايي نيازمند توجه زياد و تلاش وافر در تعميم دادن يک نمره واحد است، آنها بيشتر به جاي قاعده يا حکم، موارد استثنايي را نشان مي دهند.

پايايي تفسير کلي


توجه بيش از حد به رويکردهاي مختلف در تعيين پايايي ممکن است از لحاظ علمي خطر از دست دادن موضوع اصلي در پايايي را به همراه داشته باشد. آزمونها فنون جمع آوري اطلاعات مربوط به شخصيت هستند و معمولاً در خصوص ارايه پيش بيني هايي درباره رفتار آتي بر مبناي عملکرد شخصيت استوارند. به همين دليل، توجه غايي ما به پايايي بايد معطوف اين باشد که کدام آزمون مطرح است؛ يعني، هرگاه آزمون رورشاخ براي به دست آوردن توصيف جامعي از عملکرد کلي شخصيت به کار رود، آن گاه موضوع اصلي، پايايي اين توصيفهاي کلي است و نه پايايي طبقه هاي نمره گذاري فردي.

در ارزيابي پاياييهاي کلي چه چيزي مورد توجه قرار دارد؟ اين روشها به روشهايي شباهت دارند که قبلاً توصيف شدند. براي مثال، پايايي حاصل از روش دو نيمه سازي را مي توان با مقايسه تفسيرهاي حاصل از بررسي نيمه هاي قابل مقايسه آزمون ارزيابي کرد؛ پايايي حاصل از روش بازآزمايي شامل مقايسه تفسيرهاي حاصل از دو اجراي مختلف آزمون است؛ و پايايي بين داوران را مي توان با مقايسه تفسيرهاي حاصل از اجراي يک آزمون که توسط داوران مختلف صورت گرفته است، تعيين کرد. پايايي بين آزمايندگان را نيز مي توان به روش مشابهي ارزيابي کرد.

براي ارايه توصيفهاي کلي شخصيت که به طور آماري مي توان به همين شيوه آنها را با يکديگر مقايسه کرد، چهارچوبهاي توصيفي چندي در خصوص شخصيت مورد نياز است. يک روش موسوم کاربرد مجموعه اي از مقياسها يا ابعاد درجه بندي است که با آزمون و نوع اطلاعات توصيفي مورد نياز متناسب هستند. بدين ترتيب، تفسير به دنبال بررسي طرح کلي آزمون، با اختصاص دادن نمره ها يا جايگاهها به آزمودنيها بر اساس اين مقياسها صورت مي گيرد. يا آزمايندگان مي توانند به تعدادي از سؤالهاي صحيح - غلط يا چندگزينه اي در خصوص موضوع پاسخ دهند. روش مرسوم ديگر، استفاده از فن دسته بندي پرسش است. يک دسته بندي پرسش معمولي شامل 100 کارت است که هر کدام يک توصيف شخصيت را در بر مي گيرد. از آزماينده خواسته مي شود که طرح کلي آزمون را مطالعه کند و بعد، عبارتهاي توصيفي را در 9 دسته طبقه بندي کند که از حداقل وصف حال تا حداکثر وصف حال آزمودني را در بر مي گيرد. تعداد کارتهايي که در هر دسته قرار مي گيرند از قبل تعيين مي شوند. به طوري که هر داور توزيع يکساني از کارتها را به دست مي دهد. در تمام اين فنون، همبستگي رتبه اي يا درصد توافق روشها را مي توان براي تعيين يک شاخص عددي پايايي به کار برد (هرگاه قصد داشته باشيم که پاياييهاي مربوط به يک آزماينده واحد را تعيين کنيم، تعداد طرحهاي آزمونهاي مورد داوري بايد به اندازه کافي زياد باشد که آزماينده نتواند به ياد آورد يا حدس بزند که کدام مورد به کدام آزمودني تعلق داشته است).

پايايي به دست آمده از هر روش ارزيابي بايد با کاربرد همان روش متناسب باشد. هرگاه پيش بيني هاي مربوط به رويدادهاي به خصوصي ارايه شود، پايايي اين پيش بيني ها بايد مورد بررسي قرار گيرد. هرگاه توصيفهاي کلي شخصيت مورد توجه باشد، اين پاياييهاي آنهاست که مورد توجه قرار مي گيرند. گرچه اغلب منابع اساسي ديگري نيز در زمينه پايايي وجود دارد (مانند پايايي نمره گذار) که پاياييهاي نهايي به آنها بستگي دارند، پايايي روش مورد استفاده، سؤال مربوط به علاقه نهايي است.

پي نوشت:


807- Ghiselli

808- Nunnally

809- Bernstein

810- Dahlstrom

811- Welsh

812- Raymond B. Cattell

813- Gleser

814- Nanda

815- Rajaratnam

816- Jones

817- Reid

818- Holtzman

819- Gross

820- Murstein

821- Holt


منبع:تالیف:آی . لانیون،ریچارد و دی فلئونارد ، ترجمه:نقشبندی،سیامک و .... «ارزيابي شخصيت» ، نشر روان ،1385