مروری بر پژوهشها: روی آوردهای نوین در دوران سنجی (قسمت سوم) مدلهای نظریه سؤال - پاسخ، مدلهای راش
مروری بر پژوهشها رویآوردهای نوین در روانسنجی قسمت سوم:مدلهای نظریه سؤال-پاسخ،مدلهای راش
New Approaches to Psychometrics part Three:Models of Item Response Theory,Rasch Models
علی عسگری
دانشجوی دکتری
دانشگاه تهران
Ali Asgari PhD Candidate Tehran University
در هفتاد سال گذشته نظریهپردازان متعددی تلاش کردهاند تا نشان دهند که چگونه میتوان از اندازهها و فراوانیهای عینی،1،اندازههای انتزاعی2به دست آورد.یکی از عملیترین و رایجترین رویآوردهایی که برای این منظور به کار میرود، مدل راش3است.جورج راش،ریاضیدان دانمارکی،این رویآورد را در سال 3591 و به منظور تحلیل پاسخهای یک رشته از آزمونهای خواندن به وجود آورد.با آنکه وی را پدر تحلیل راش میدانند،اما بنجامین رایت4را باید قیم قانونی آن دانست.رایت و همکارانش در دانشگاه شیکاگو روشهای پیشرفته و ابزارهای تحلیل راش را توسعه،و کاربرد آن را در حوزههای مختلف عملی ارتقا بخشیدند(ماسوف و فیشر،2002).
مدلهای رایش در واقع رویآوردی ریاضی برای آزمون این فرضیه است که اندازههای مربوط به معنا5و واحد یک سازه را میتوان از ابزاری که برای آن خصیصه تهیه شده است به دست آورد.وقتی دادهها با این مدلها برازش پیدا میکنند به معنای آن است که ابزار اندازهگیری و اندازهها در یک واحد فاصلهای مشترک مقیاسبندی شدهاند و میتوانند در انواع یا شکلهای مختلف آن ابزار و نیز در بین نمونههای مختلف یک جامعه ثابت باقی بمانند(رایت و استون،9791).
مدلهای راش،در واقع نوعی آزمون همسانی درونی6در نظریه سؤال-پاسخاند که برای دادههای دوارزشی و چند ارزشی به کار میروند.در این مدلها نیز مانند مقیاسهای گاتمن7،فرض بر این است که همه سؤالها و مواد یک آزمون که یکسازه را اندازهگیری میکنند،یک نوع رابطه مرتب شده8را تشکیل میدهند.یک آزمون ممکن است دارای همسانی درونی مرتبشدهای باشد،حتی اگر مجموعه سؤالهای آن همبستگی بالایی باهم نداشته باشند(همسانی درونی جمعپذیر9،مانند آنچه از طریق آلفای کرونباخ01یا تحلیل عاملی11آزمون میشود).همسانی درونی مرتب شده بیانگر وجود عامد دشواری است.بدین ترتیب،یک سؤال دشوار میتواند پاسخ به سؤالهای با دشواری کمتر را پیشبینی کند اما عکس آن امکانپذیر نیست(رایت،6991).
وقتی پژوهشگران برای رواسازی یک مجموعه از متغیرهای نشانگر در یک مقیاس از تحلیل عاملی استفاده میکنند، فرض را بر این قرار میدهند که با یک مدل خطی و جمعپذیر روبهرو هستند.خطی بودن بخشی از همبستگی و مبنایی برای خوشهبندی21متغیرهای نشانگر در یک عامل است.در جمعپذیری نیز فرض بر این است فقط زمانی معنای همه سؤالها دارای همسانی درونی است،که همبستگی بالایی با یکدیگر داشته باشند.باوجوداین،ممکن است که سؤالها فاقد همبستگی درونی بالا،اما دارای رابطه مرتبشده نیرومندی باشند(رایت،5891).به همین دلیل بسیاری از پژوهشگران ترجیح میدهند برای ساخت و توسعه مقیاسها به جای مدلهای جمعپذیر مانند آلفای کرونباخ و تحلیل عاملی،از مدلهای راش استفاده کنند.زیرا این مدلها نه تنها روابط جمعپذیر بین متغیرهای نشانگر،بلکه رابطه ترتیبی سؤالها(مانند ترتیب (1). concrete
(2). abstract
(3). Rasch
(4). Wright,B.D.
(5). meaning
(6). internal consistency
(7). Guttmann
(8). ordered relationship
(9). additively
(01). cronbach
(11). factor analysis
(21). clustering
دشواری)را نیز به حساب میآورند(تنورگرت،گیلپسی و کینگما،3991).نظریه زیربنایی مدلهای راش در بسیاری جنبهها شبیه به نظریه سؤال-پاسخ است.به بیان دیگر،مدل راش برای دادههای دو ارزشی اغلب به عنوان مدل تک پارامتری نظریه سؤال-پاسخ در نظر گرفته میشود.اما هواداران این مدل،آن را دارای ویژگی خاصی میدانند که از مدلهای IRT متمایز است.به گونه اختصاصی،ویژگی معرف مدلهای راش صورتبندی انتزاعی1و ریاضی مقایسه نامتغیر است که میتواند برای اندازهگیری موفقیتآمیز سازهها یک ملاک معتبر فراهم کند(سادوس،گارمندی،کیوز و الیوت،4002).این ویژگی انتزاعی،مدلهای رایش را از سایر مدلهایی که برای پاسخ به سؤالها یادمواد آزمون به کار میروند متمایز و آن را به عنوان مدلهای ایدهآل یا استاندارد مطرح میسازد.
بنابر نظر آندریش(4002)دیدگاه2یا پارادایم3مدلهای راش به گونه بارزی با سایر مدلهای اندازهگیری تفاوت دارد.در اغلب مدلها هدف اصلی توصیف مجموعهای از دادههاست.به همین منظور پارامترها تعدیل میشوند و برپایه اینکه چگونه با دادهها برازش مییابند،رد یا پذیرفته میشوند.اما هدف از به کار بردن مدل راش به دست آوردن دادههایی است که با مدل برازش داشته باشد.منطق زیربنایی این دیدگاه آن است که مدلهای راش مستلزم شرایطی هستند که برای اندازهگیری باید برآورده شوند.درست همانگونه که عموما در اندازهگیریهای علم فیزیک وجود دارد.
برای درک این منطق زیربنایی بیان مثالی در اندازهگیری وزن میتواند مفید باشد.فرض کنید وزن شئ A در یک موقعیت به گونه قابل ملاحظهای بیشتر از وزن شئ B اندازهگیری شده است.سپس بلافاصله در یک موقعیت دیگر،این وزن شئ B است که بیشتر از وزن A به دست میآید.در اینجا شرط اساسی اندازهگیری،یعنی یکسان و نامتغیر بودن نتایج حاصل از مقایسه دو اندازهگیری،صرفنظر از سایر عوامل،برآورده نشده است.این شرط اساسی در ساختار انتزاعی مدل راش است.بنابراین،مدلهای راش برای تناسب و برازش یافتن با دادهها،تغییر و تعدیل نمیشوند.بلکه روش اندازهگیری باید تغییر یابد تا این شرط را برآورده سازد.درست همانگونه که در مثال بالا مقیاس وزن باید تغییر کند.زیرا بین دو شئ در دو اندازهگیری جداگانه نتایج متفاوتی به دست داده است.علاوه بر این،در پارادایم مدلهای رایش تأکید بر مطالعه و تعیین بینظمی4در دادههاست که از طریق این مدل آشکار میشود(رایت،6991).
خانواده مدلهای راش
لاینرس(6002)مدلهای راش را در دو طبقه کلی دو ارزشی و چندارزشی به شرح زیر تقسیمبندی میکند:
مدل دو ارزشی:این مدل که در آن پاسخها به دو طبقه(بلی-خیر،درست-نادرست)تقسیم میشوند،شناختهشدهترین و رایجترین مدل راش و دارای تابع ساده منطقی است.برای دادههای دو ارزشی جایگاه یک سؤال در یک مقیاس،متناظر یا جایگاه آزمودنی در نقطهای است که احتمال موفقیت برابر با 0/5 است.به گونه کلی،احتمال پاسخ درست آزمودنی به یک سؤال با درجه دشواری کمتر از جایگاه آزمودنی،بیشتر از 0/5 و احتمال پاسخ درست آزمودنی به یک سؤال با درجه دشواری بالاتر از جایگاه آزمودنی،کمتر از 0/5 است.وقتی پاسخ فرد برپایه دشواری سؤال از کمترین تا بیشترین فهرست شود،بیشترین شباهت را به الگوی گاتمن دارد.با این فرمول: Loge(Pnil/Pin0)-B n-D i
که در آن:
P ni -احتمال آنکه آزمودنی n که با سؤال i روبهرو میشود در طبقه j -اندازهگیری میشود.
B n -توانایی فرد n
D ij -دشواری سؤال i ،نقطهای که در آن بالاترین و پایینترین طبقههای سؤال احتمال برابر دارند.
F ij اندازه مدرج کردن طبقه j-1 .نقطهای که در آن طبقههای j-1 و j نسبت به اندازه سؤال احتمال برابر دارند.
مدلهای چندارزشی:مدلهای چندارزشی راش نخستین بار توسط اندریش(8791،4002)و به منظور کاربرد مدل راش (1). formal
(2). perspective
(3). Paradigm
(4). anomalies
برای دادههای حاصل از مقیاس لیکرت ارائه شد.این مدلها در واقع تعمیم مدلهای دو ارزشی و نوعی مدل اندازهگیری است که در زمینههایی به کار میرود که هدف از آن اندازهگیری صفت با توانایی از طریق فرایندی است که در آن پاسخ به سؤالها با اعداد صحیح متوالی نمرهگذاری شود این مدل را میتوان در مقیاسهای لیکرت،درجهبندی و نیز سؤالهای مربوط به اندازهگیریهای ترتیبی که در آنها نمرههای متوالی بالاتر بیانگر سطح فزاینده پیشرفت و توانمندی است به کار برد.
از سوی دیگر،مدلهای چندارزشی یک اندازهگیری احتمالی کلی و دارای این ویژگی متمایز است که برای کاربرد نمرههای عددی متوالی یک بنیان نظری محکم فراهم آورده است.افزون بر این ویژگی،مدلهای چندارزشی امکان آزمون جدی این فرضیه را فراهم میآورد که طبقههای پاسخ،معرف سطح افزایشی یک خصیصه یا صفت مکنون است.ازاینرو دادهها،مرتب شده به حساب میآیند.در این مدل،نمره یک سؤال معین در واقع فراوانی تعداد جایگاه آستانه1در صفت مکنونی است که آزمودنی از آن بالاتر قرار دارد.جایگاه آستانه بر روی پیوستار مکنون معمولا از ماتریس سؤال-پاسخ و از طریق فرآیند برآورد بیشینه احتمال شرطی2استنباط میشود.
به گونه کلی،شاخص اصلی فرایند اندازهگیری در این مدل آن است که آزمودنیها در یک مجموعه طبقههای مرتب شده مجاور3گروهبندی شوند.شکلبندی پاسخهایی که در یک زمینه آزمایشی معین به کار میروند،میتواند از طریق روشهای مختلفی به این شاخص دست یابد.برای نمونه،ممکن است آزمودنی طبقهای را انتخاب کند که به نظر وی به بهترین صورت سطح حمایت وی را از سؤال یا عبارت نشان میدهد.افزون بر این،امکان دارد داوران آزمودنیها را برپایه ملاکهایی که به خوبی تعریف شدهاند در طبقههای مختلف قرار دهند،و سرانجام ممکن است آزمودنی یک محرک فیزیکی را برپایه شباهتی که به مجموعه محرکهای مرجع دارد،طبقهبندی کند.وقتی پاسخها فقط در دو طبقه قرار داشته باشند،مدل چندارزشی راش به مدلی برای دادههای دوارزشی تبدیل میشود.در این مدل خاص،دشواری سؤال و آستانه(منفرد)یکسان خواهد بود.انواع مدلهای چندارزشی به قرار زیرند:
1)مدل مقیاس درجهبندی4:این مدل زمانی به کار میرود که تعداد آستانه سؤالها یکسان و تفاوت بین جایگاه هر آستانه معین با میانگین جایگاه آستانهها برابر یا بین همه سؤالها یکسان باشد.فرمول این مدل به قرار زیر است:
Log(Pn ij/Pn i(j-1)-B n-D i-F j 2)مدل امتیاز جزئی5:از این مدل اختصاصا در زمینههای آموزشی و تربیتی استفاده میشود(مسترز،2891).هرچند ساختار ریاضی این مدل با مدل مقیاس درجهبندی یکسان است،اما امکان محاسبه آستانههای مختلف را برای سؤالهای مختلف فراهم میآورد.فرمول این مدل عبارت است از:
Log(Pn ij/Pni(j-1)-B n-D i-F ij-B n-D ij
3)مدل ساختار پاسخ گروهبندی شده6:این مدل با فرمول زیر وقتی به کار میرود که سؤالها براساس سهمی که در ساختار پاسخ دارند،یا به زیرمقیاسهای یک یا چند سؤال که در یک ساختار پاسخ سهیم هستند گروهبندی شوند.
Log(Pn ij/Pn i(j-1)-B n-D ig-F gj
به گونه کلی،مدلهای اندازهگیری راش به پژوهشگران امکان میدهد تا مشکلات زیربنایی اندازهگیریهای مدل کلاسیک و مقیاسهای خودسنجی،خودارزیابی و خود درجهبندی را حل کنند.این مدلها نمونه کاملی از اندازهگیری جمعپذیر زوجیب است که دو شرط لازم برای تبدیل خصیصه به کمیت،یعنی جمعپذیر بودن و ترتیب را برآورده میسازد.مدل راش جمعپذیر است زیرا تفاوت بین سطح مشاهده شده و سطح مکنون،مستلزم اندازهگیری جمعپذیر دو متغیر مکنون متفاوت یعنی متغیرهای آزمودنی و سؤال است.افزون بر این،مدل راش دارای ترتیب است زیرا برپایه آن میتوان متغیرهای آزمودنی و سؤال را در سطح مکنون و از طریق بالاتر یا پایینتر بودن نسبت به هم با یکدیگر مقایسه کرد(اکتون، (1). threshold location
(2). conditional maximum likelihood
(3). contiguous
(4). rating scale
(5). partial credit
(6). grouped response-structure
3002).برخی از مزایای کاربرد مدلهای اندازهگیری عبارتند:
1)از پاسخهایی که در قالب مقیاس طبقهای مرتب یا ترتیبی ارائه شوند،میتوان یک اندازه فاصلهای حقیقی تولید کرد(روایت و لایرنس،9891؛مربیتز،موریس و گریپ،9891).
2)مشخص میشود هر سؤال تا چه حد میتواند سازه موردنظر را اندازهگیری کند.به بیان دیگر،این مدل نشان میدهد که آیا سؤالهای مقیاس،یک سازه زیربنایی یا یک بعد واحد را تشکیل میدهند.این فرایند در واقع تکبعدی بودن مقیاس را آزمون میکند(رایت و استون،6991).
3)میتوان نشان داد که هر سؤال چه جایگاهی در پویستار اندازهگیری دارد.تعیین ترتیب سؤالها در پیوستار اندازهگیری از اهمیت زیادی در ارزیابی روایی مقیاس برخوردار است.زیرا توزیع سؤالها در طول پیوستار باید معنادار باشد تا نشان دهد سازه موردنظر به خوبی اندازهگیری شده است.افزون بر این،شواهد مربوط به همسانی نسبی این توزیع در طول زمان یا در بین نمونههای مختلف،نشان میدهد که سازه مورد اندازهگیری پایایی دارد(اسمیت،1002).
4)میتوان تعیین کرد که مقیاس تا چه اندازه توانسته است آزمودنیها را اندازهگیری کند.مدل راش افزون بر اینکه نشان میدهد آیا مقیاس برای اندازهگیری آزمودنیها به گونه مناسب تهیه شده،مشخص میکند که آیا هر آزمودنی نیز به گونه معتبری اندازهگیری شده است(آیا نمره افراد مطابق با الگوی مورد انتظار است).به بیان دیگر،روشهای راش نه تنها برای بررسی ویژگیهای آزمون مفیدند بلکه میتوانند راهنمای مناسبی برای توسعه مقیاس نیز باشند.
منابع
(به تصویر صفحه مراجعه شود)
پایان مقاله