عنوان مقاله: مروری بر پژوهشها: روی آوردهای نوین در دوران سنجی (قسمت سوم) مدلهای نظریه سؤال - پاسخ، مدلهای راش (4 صفحه)
نویسنده : عسگری، علی
چکیده :
کلمات کلیدی :
روانشناسنان ایرانی » شماره 13 (صفحه 80)

مروری بر پژوهشها روی‏آوردهای نوین در روان‏سنجی‏ قسمت سوم:مدلهای نظریه سؤال-پاسخ،مدلهای راش

New Approaches to Psychometrics part Three:Models of Item Response Theory,Rasch Models

علی عسگری

دانشجوی دکتری

دانشگاه تهران

Ali Asgari PhD Candidate Tehran University

در هفتاد سال گذشته نظریه‏پردازان متعددی تلاش کرده‏اند تا نشان دهند که چگونه می‏توان از اندازه‏ها و فراوانیهای‏ عینی،1،اندازه‏های انتزاعی‏2به دست آورد.یکی از عملی‏ترین و رایج‏ترین روی‏آوردهایی که برای این منظور به کار می‏رود، مدل راش‏3است.جورج راش،ریاضیدان دانمارکی،این روی‏آورد را در سال 3591 و به منظور تحلیل پاسخهای یک رشته‏ از آزمونهای خواندن به وجود آورد.با آنکه وی را پدر تحلیل راش می‏دانند،اما بنجامین رایت‏4را باید قیم قانونی آن‏ دانست.رایت و همکارانش در دانشگاه شیکاگو روشهای پیشرفته و ابزارهای تحلیل راش را توسعه،و کاربرد آن را در حوزه‏های مختلف عملی ارتقا بخشیدند(ماسوف و فیشر،2002).

مدلهای رایش در واقع روی‏آوردی ریاضی برای آزمون این فرضیه است که اندازه‏های مربوط به معنا5و واحد یک سازه‏ را می‏توان از ابزاری که برای آن خصیصه تهیه شده است به دست آورد.وقتی داده‏ها با این مدلها برازش پیدا می‏کنند به‏ معنای آن است که ابزار اندازه‏گیری و اندازه‏ها در یک واحد فاصله‏ای مشترک مقیاس‏بندی شده‏اند و می‏توانند در انواع یا شکلهای مختلف آن ابزار و نیز در بین نمونه‏های مختلف یک جامعه ثابت باقی بمانند(رایت و استون،9791).

مدلهای راش،در واقع نوعی آزمون همسانی درونی‏6در نظریه سؤال-پاسخ‏اند که برای داده‏های دوارزشی و چند ارزشی به کار می‏روند.در این مدلها نیز مانند مقیاسهای گاتمن‏7،فرض بر این است که همه سؤالها و مواد یک آزمون که‏ یک‏سازه را اندازه‏گیری می‏کنند،یک نوع رابطه مرتب شده‏8را تشکیل می‏دهند.یک آزمون ممکن است دارای همسانی‏ درونی مرتب‏شده‏ای باشد،حتی اگر مجموعه سؤالهای آن همبستگی بالایی باهم نداشته باشند(همسانی درونی‏ جمع‏پذیر9،مانند آنچه از طریق آلفای کرونباخ‏01یا تحلیل عاملی‏11آزمون می‏شود).همسانی درونی مرتب شده بیانگر وجود عامد دشواری است.بدین ترتیب،یک سؤال دشوار می‏تواند پاسخ به سؤالهای با دشواری کمتر را پیش‏بینی کند اما عکس آن امکان‏پذیر نیست(رایت،6991).

وقتی پژوهشگران برای رواسازی یک مجموعه از متغیرهای نشانگر در یک مقیاس از تحلیل عاملی استفاده می‏کنند، فرض را بر این قرار می‏دهند که با یک مدل خطی و جمع‏پذیر روبه‏رو هستند.خطی بودن بخشی از همبستگی و مبنایی‏ برای خوشه‏بندی‏21متغیرهای نشانگر در یک عامل است.در جمع‏پذیری نیز فرض بر این است فقط زمانی معنای همه‏ سؤالها دارای همسانی درونی است،که همبستگی بالایی با یکدیگر داشته باشند.باوجوداین،ممکن است که سؤالها فاقد همبستگی درونی بالا،اما دارای رابطه مرتب‏شده نیرومندی باشند(رایت،5891).به همین دلیل بسیاری از پژوهشگران‏ ترجیح می‏دهند برای ساخت و توسعه مقیاسها به جای مدلهای جمع‏پذیر مانند آلفای کرونباخ و تحلیل عاملی،از مدلهای‏ راش استفاده کنند.زیرا این مدلها نه تنها روابط جمع‏پذیر بین متغیرهای نشانگر،بلکه رابطه ترتیبی سؤالها(مانند ترتیب‏ (1). concrete

(2). abstract

(3). Rasch

(4). Wright,B.D.

(5). meaning

(6). internal consistency

(7). Guttmann

(8). ordered relationship

(9). additively

(01). cronbach

(11). factor analysis

(21). clustering

روانشناسنان ایرانی » شماره 13 (صفحه 81)

دشواری)را نیز به حساب می‏آورند(تنورگرت،گیلپسی و کینگما،3991).نظریه زیربنایی مدلهای راش در بسیاری جنبه‏ها شبیه به نظریه سؤال-پاسخ است.به بیان دیگر،مدل راش برای داده‏های دو ارزشی اغلب به عنوان مدل تک پارامتری‏ نظریه سؤال-پاسخ در نظر گرفته می‏شود.اما هواداران این مدل،آن را دارای ویژگی خاصی می‏دانند که از مدلهای‏ IRT متمایز است.به گونه اختصاصی،ویژگی معرف مدلهای راش صورتبندی انتزاعی‏1و ریاضی مقایسه نامتغیر است که‏ می‏تواند برای اندازه‏گیری موفقیت‏آمیز سازه‏ها یک ملاک معتبر فراهم کند(سادوس،گارمندی،کیوز و الیوت،4002).این‏ ویژگی انتزاعی،مدلهای رایش را از سایر مدلهایی که برای پاسخ به سؤالها یادمواد آزمون به کار می‏روند متمایز و آن را به‏ عنوان مدلهای ایده‏آل یا استاندارد مطرح می‏سازد.

بنابر نظر آندریش(4002)دیدگاه‏2یا پارادایم‏3مدلهای راش به گونه بارزی با سایر مدلهای اندازه‏گیری تفاوت دارد.در اغلب مدلها هدف اصلی توصیف مجموعه‏ای از داده‏هاست.به همین منظور پارامترها تعدیل می‏شوند و برپایه اینکه چگونه‏ با داده‏ها برازش می‏یابند،رد یا پذیرفته می‏شوند.اما هدف از به کار بردن مدل راش به دست آوردن داده‏هایی است که با مدل برازش داشته باشد.منطق زیربنایی این دیدگاه آن است که مدلهای راش مستلزم شرایطی هستند که برای‏ اندازه‏گیری باید برآورده شوند.درست همانگونه که عموما در اندازه‏گیریهای علم فیزیک وجود دارد.

برای درک این منطق زیربنایی بیان مثالی در اندازه‏گیری وزن می‏تواند مفید باشد.فرض کنید وزن شئ‏ A در یک‏ موقعیت به گونه قابل ملاحظه‏ای بیشتر از وزن شئ‏ B اندازه‏گیری شده است.سپس بلافاصله در یک موقعیت دیگر،این‏ وزن شئ‏ B است که بیشتر از وزن‏ A به دست می‏آید.در اینجا شرط اساسی اندازه‏گیری،یعنی یکسان و نامتغیر بودن‏ نتایج حاصل از مقایسه دو اندازه‏گیری،صرف‏نظر از سایر عوامل،برآورده نشده است.این شرط اساسی در ساختار انتزاعی‏ مدل راش است.بنابراین،مدلهای راش برای تناسب و برازش یافتن با داده‏ها،تغییر و تعدیل نمی‏شوند.بلکه روش‏ اندازه‏گیری باید تغییر یابد تا این شرط را برآورده سازد.درست همانگونه که در مثال بالا مقیاس وزن باید تغییر کند.زیرا بین دو شئ در دو اندازه‏گیری جداگانه نتایج متفاوتی به دست داده است.علاوه بر این،در پارادایم مدلهای رایش تأکید بر مطالعه و تعیین بی‏نظمی‏4در داده‏هاست که از طریق این مدل آشکار می‏شود(رایت،6991).

خانواده مدلهای راش

لاینرس(6002)مدلهای راش را در دو طبقه کلی دو ارزشی و چندارزشی به شرح زیر تقسیم‏بندی می‏کند:

مدل دو ارزشی:این مدل که در آن پاسخها به دو طبقه(بلی-خیر،درست-نادرست)تقسیم می‏شوند،شناخته‏شده‏ترین‏ و رایج‏ترین مدل راش و دارای تابع ساده منطقی است.برای داده‏های دو ارزشی جایگاه یک سؤال در یک مقیاس،متناظر یا جایگاه آزمودنی در نقطه‏ای است که احتمال موفقیت برابر با 0/5 است.به گونه کلی،احتمال پاسخ درست آزمودنی به‏ یک سؤال با درجه دشواری کمتر از جایگاه آزمودنی،بیشتر از 0/5 و احتمال پاسخ درست آزمودنی به یک سؤال با درجه‏ دشواری بالاتر از جایگاه آزمودنی،کمتر از 0/5 است.وقتی پاسخ فرد برپایه دشواری سؤال از کمترین تا بیشترین فهرست‏ شود،بیشترین شباهت را به الگوی گاتمن دارد.با این فرمول: Loge(Pnil/Pin0)-B n-D i

که در آن:

P ni -احتمال آنکه آزمودنی‏ n که با سؤال‏ i روبه‏رو می‏شود در طبقه‏ j -اندازه‏گیری می‏شود.

B n -توانایی فرد n

D ij -دشواری سؤال‏ i ،نقطه‏ای که در آن بالاترین و پایین‏ترین طبقه‏های سؤال احتمال برابر دارند.

F ij اندازه مدرج کردن طبقه‏ j-1 .نقطه‏ای که در آن طبقه‏های‏ j-1 و j نسبت به اندازه سؤال احتمال برابر دارند.

مدلهای چندارزشی:مدلهای چندارزشی راش نخستین بار توسط اندریش(8791،4002)و به منظور کاربرد مدل راش‏ (1). formal

(2). perspective

(3). Paradigm

(4). anomalies

روانشناسنان ایرانی » شماره 13 (صفحه 82)

برای داده‏های حاصل از مقیاس لیکرت ارائه شد.این مدلها در واقع تعمیم مدلهای دو ارزشی و نوعی مدل اندازه‏گیری‏ است که در زمینه‏هایی به کار می‏رود که هدف از آن اندازه‏گیری صفت با توانایی از طریق فرایندی است که در آن پاسخ‏ به سؤالها با اعداد صحیح متوالی نمره‏گذاری شود این مدل را می‏توان در مقیاسهای لیکرت،درجه‏بندی و نیز سؤالهای‏ مربوط به اندازه‏گیریهای ترتیبی که در آنها نمره‏های متوالی بالاتر بیانگر سطح فزاینده پیشرفت و توانمندی است به کار برد.

از سوی دیگر،مدلهای چندارزشی یک اندازه‏گیری احتمالی کلی و دارای این ویژگی متمایز است که برای کاربرد نمره‏های عددی متوالی یک بنیان نظری محکم فراهم آورده است.افزون بر این ویژگی،مدلهای چندارزشی امکان آزمون‏ جدی این فرضیه را فراهم می‏آورد که طبقه‏های پاسخ،معرف سطح افزایشی یک خصیصه یا صفت مکنون است.ازاین‏رو داده‏ها،مرتب شده به حساب می‏آیند.در این مدل،نمره یک سؤال معین در واقع فراوانی تعداد جایگاه آستانه‏1در صفت‏ مکنونی است که آزمودنی از آن بالاتر قرار دارد.جایگاه آستانه بر روی پیوستار مکنون معمولا از ماتریس سؤال-پاسخ و از طریق فرآیند برآورد بیشینه احتمال شرطی‏2استنباط می‏شود.

به گونه کلی،شاخص اصلی فرایند اندازه‏گیری در این مدل آن است که آزمودنیها در یک مجموعه طبقه‏های مرتب شده‏ مجاور3گروه‏بندی شوند.شکل‏بندی پاسخهایی که در یک زمینه آزمایشی معین به کار می‏روند،می‏تواند از طریق روشهای‏ مختلفی به این شاخص دست یابد.برای نمونه،ممکن است آزمودنی طبقه‏ای را انتخاب کند که به نظر وی به بهترین‏ صورت سطح حمایت وی را از سؤال یا عبارت نشان می‏دهد.افزون بر این،امکان دارد داوران آزمودنیها را برپایه‏ ملاکهایی که به خوبی تعریف شده‏اند در طبقه‏های مختلف قرار دهند،و سرانجام ممکن است آزمودنی یک محرک‏ فیزیکی را برپایه شباهتی که به مجموعه محرکهای مرجع دارد،طبقه‏بندی کند.وقتی پاسخها فقط در دو طبقه قرار داشته باشند،مدل چندارزشی راش به مدلی برای داده‏های دوارزشی تبدیل می‏شود.در این مدل خاص،دشواری سؤال و آستانه(منفرد)یکسان خواهد بود.انواع مدلهای چندارزشی به قرار زیرند:

1)مدل مقیاس درجه‏بندی‏4:این مدل زمانی به کار می‏رود که تعداد آستانه سؤالها یکسان و تفاوت بین جایگاه هر آستانه معین با میانگین جایگاه آستانه‏ها برابر یا بین همه سؤالها یکسان باشد.فرمول این مدل به قرار زیر است:

Log(Pn ij/Pn i(j-1)-B n-D i-F j 2)مدل امتیاز جزئی‏5:از این مدل اختصاصا در زمینه‏های آموزشی و تربیتی استفاده می‏شود(مسترز،2891).هرچند ساختار ریاضی این مدل با مدل مقیاس درجه‏بندی یکسان است،اما امکان محاسبه آستانه‏های مختلف را برای سؤالهای‏ مختلف فراهم می‏آورد.فرمول این مدل عبارت است از:

Log(Pn ij/Pni(j-1)-B n-D i-F ij-B n-D ij

3)مدل ساختار پاسخ گروه‏بندی شده‏6:این مدل با فرمول زیر وقتی به کار می‏رود که سؤالها براساس سهمی که در ساختار پاسخ دارند،یا به زیرمقیاسهای یک یا چند سؤال که در یک ساختار پاسخ سهیم هستند گروه‏بندی شوند.

Log(Pn ij/Pn i(j-1)-B n-D ig-F gj

به گونه کلی،مدلهای اندازه‏گیری راش به پژوهشگران امکان می‏دهد تا مشکلات زیربنایی اندازه‏گیریهای مدل کلاسیک‏ و مقیاسهای خودسنجی،خودارزیابی و خود درجه‏بندی را حل کنند.این مدلها نمونه کاملی از اندازه‏گیری جمع‏پذیر زوجیب‏ است که دو شرط لازم برای تبدیل خصیصه به کمیت،یعنی جمع‏پذیر بودن و ترتیب را برآورده می‏سازد.مدل راش‏ جمع‏پذیر است زیرا تفاوت بین سطح مشاهده شده و سطح مکنون،مستلزم اندازه‏گیری جمع‏پذیر دو متغیر مکنون متفاوت‏ یعنی متغیرهای آزمودنی و سؤال است.افزون بر این،مدل راش دارای ترتیب است زیرا برپایه آن می‏توان متغیرهای‏ آزمودنی و سؤال را در سطح مکنون و از طریق بالاتر یا پایین‏تر بودن نسبت به هم با یکدیگر مقایسه کرد(اکتون، (1). threshold location

(2). conditional maximum likelihood

(3). contiguous

(4). rating scale

(5). partial credit

(6). grouped response-structure

روانشناسنان ایرانی » شماره 13 (صفحه 83)

3002).برخی از مزایای کاربرد مدلهای اندازه‏گیری عبارتند:

1)از پاسخهایی که در قالب مقیاس طبقه‏ای مرتب یا ترتیبی ارائه شوند،می‏توان یک اندازه فاصله‏ای حقیقی تولید کرد(روایت و لایرنس،9891؛مربیتز،موریس و گریپ،9891).

2)مشخص می‏شود هر سؤال تا چه حد می‏تواند سازه موردنظر را اندازه‏گیری کند.به بیان دیگر،این مدل نشان‏ می‏دهد که آیا سؤالهای مقیاس،یک سازه زیربنایی یا یک بعد واحد را تشکیل می‏دهند.این فرایند در واقع تک‏بعدی‏ بودن مقیاس را آزمون می‏کند(رایت و استون،6991).

3)می‏توان نشان داد که هر سؤال چه جایگاهی در پویستار اندازه‏گیری دارد.تعیین ترتیب سؤالها در پیوستار اندازه‏گیری از اهمیت زیادی در ارزیابی روایی مقیاس برخوردار است.زیرا توزیع سؤالها در طول پیوستار باید معنادار باشد تا نشان دهد سازه موردنظر به خوبی اندازه‏گیری شده است.افزون بر این،شواهد مربوط به همسانی نسبی این توزیع در طول زمان یا در بین نمونه‏های مختلف،نشان می‏دهد که سازه مورد اندازه‏گیری پایایی دارد(اسمیت،1002).

4)می‏توان تعیین کرد که مقیاس تا چه اندازه توانسته است آزمودنیها را اندازه‏گیری کند.مدل راش افزون بر اینکه‏ نشان می‏دهد آیا مقیاس برای اندازه‏گیری آزمودنیها به گونه مناسب تهیه شده،مشخص می‏کند که آیا هر آزمودنی نیز به‏ گونه معتبری اندازه‏گیری شده است(آیا نمره افراد مطابق با الگوی مورد انتظار است).به بیان دیگر،روشهای راش نه تنها برای بررسی ویژگیهای آزمون مفیدند بلکه می‏توانند راهنمای مناسبی برای توسعه مقیاس نیز باشند.

منابع

(به تصویر صفحه مراجعه شود)

پایان مقاله