URL : http://www.noormags.com/view/fa/ArticlePage/324567

عنوان مقاله: مروری بر پژوهشها: روی آوردهای نوین در روان سنجی (قسمت چهارم) مدلهای نظریه سؤال - پاسخ، مدلهای ارزشی (4 صفحه)

نویسنده : عسگری، علی

چکیده :


کلمات کلیدی :


روانشناسنان ایرانی » شماره 14 (صفحه 199)

--------------------------------------------------------------------------------



مروری بر پژوهشها روی‏آوردهای نوین در روان‏سنجی‏ قسمت چهارم:مدلهای نظریه سؤال-پاسخ،مدلهای دو ارزشی

New Approaches to Psychometrics Part Four:Models of Item Response Theory,Dichotomous Models Ali Asgari,PhD University of Welfare and Rehabilitation 


برای بررسی داده‏های دو ارزشی مدلهای متعددی در IRT وجود دارد.اما انتخاب یک مدل باید برپایه ملاحظات نظری و تجربی،مانند برازش داده-مدل‏1صورت گیرد.هر مدل با استفاده از ارزش عددی یک یا چند پارامتر،خم ویژه بخصوصی‏ را معین می‏کند و از لحاظ انتقال اطلاعات درباره ویژگیهای فنی سؤالها ابزار مفیدی به شمار می‏آید(بیکر،2002/1831). به منظور محاسبه احتمال پاسخ درست در سطوح مختلف توانایی،هریک از مدلها از یک معادله ریاضی استفاده می‏کنند.


به گونه کلی،مدلهای‏ IRT را می‏توان به دو خانواده مدلهای تک‏بعدی‏2و چندبعدی‏3تقسیم کرد(تیسن و اورلاندو، 1002،رایت،2991).مدلهای تک‏بعدی مستلزم تنها یک بعد واحد از خصیصه(توانایی)است.درحالی‏که،در مدلهای‏ چندبعدی فرض بر آن است که داده‏ها از خصایص چند وجهی یا چندگانه به دست می آیند.باوجوداین،به دلیل‏ پیچیدگی فزاینده مدلهای چندبعدی،در بیشتر پژوهشها و کاربردهای‏ IRT از مدلهای تک‏بعدی استفاده می‏شود.


افزون بر این،مدلهای‏ IRT برپایه تعداد پاسخهای نمره‏گذاری شده نیز طبقه‏بندی می‏شود.یک سؤال چند گزینه‏ای‏ در واقع یک مدل دو ارزشی است حتی اگر دارای چهار یا پنج گزینه باشد.زیرا فقط به‏گونه درست/نادرست(صحیح/غلط) نمره‏گذاری می‏شود.طبقه دیگر مدلها،برای داده‏های چند ارزشی به کار می‏روند که در آن مقدار نمره هر پاسخ متفاوت‏ است.برای نمونه،چنانکه در قسمت قبل بیان شد،مدل چند ارزشی راش در واقع تعمیم این مدل به داده‏های مربوط به‏ دو یا چند طبقه مرتب شده است.مدلهای دو ارزشی‏ IRT را می‏تون برپایه تعداد پارامترهایی که در آنها به کار می‏رود نیز توصیف کرد.بدین ترتیب،در مدل سه پارامتری،هر سه پارامتر دشواری( b ،جایگاه سؤال)،قدرت تشخیص( a ،شیب‏ سؤال)و حدس( c ،مجانب‏5پایین خم ویژه)به کار می‏روند.درحالی‏که در مدل دو پارامتری فرض بر این است که داده‏ها کمینه حدس را دارند اما براساس جایگاه و قدرت تشخیص سؤال متغیرند،و سرانجام در مدل تک پارامتری مقدار حدس‏ و قدرت تشخیص سؤالها برابر فرض می‏شوند و تنها جایگاه سؤال برآورد می‏شود.افزون بر این،از لحاظ نظری یک مدل‏ چهار پارامتری نیز وجود دارد که پارامتر چهارم آن مجانب بالایی خم ویژه است.اما این مدل به‏ندرت به کار برده می‏شود (هامبلتون و سوامیناتان،1991؛تیسن و اورلاندو،1002).



مدل پارامتری

مدل منطقی تک پارامتری ساده‏ترین مدل‏ IRT است و همانگونه که از نام آن پیداست برای کاربرد نظریه سؤال-پاسخ‏ تنها برآورد یک پارامتر،یعنی درجه دشواری‏ (b) ،برای آن لازم است.برپایه این مدل،پارامتر قدرت تشخیص برای همه‏ سؤالها ثابت و برابر با 1/0 قرار داده می‏شود؛یعنی تنها پارامتر دشواری می‏تواند مقادیر مختلفی اختیار کند.معادله این‏ مدل به قرار زیر است: Pi(?)1+e-(?-bi)/1 


که در آن: p(?) احتمال پاسخ درست برای سطح معینی از توانایی، e برابر با 2/817، -(?-b) انحراف منطقی است. model-data fit .(1)


unidimensional .(2)


multidimensional .(3)


multiple .(4)


asymptote .(5)



روانشناسنان ایرانی » شماره 14 (صفحه 200)

--------------------------------------------------------------------------------


مروری بر پژوهشها


برای نمونه،برپایه فرمول بالا،احتمال پاسخ درست به سؤالی با درجه دشواری 1/0 برای فردی که در سطح توانایی‏ (?)-/3 قرار دارد،برابر با 0/20 خواهد بود.چون مقدار پارامتر تشخیص در معادله بالا که همواره برابر با 0/1 است، معمولا در فرمول نشان داده نمی‏شود.بنابر نظر هاروی و هامر(9991)،تک پارامتر،از لحاظ اجرایی،به نمره‏ای از توانایی‏ اطلاق می‏شود که با احتمال 05 درصدی پاسخ به یک سؤال انشایی سروکار دارد.چون مقدار پارامتر قدرت تشخیص در مدل راش برابر با مقدار ثابت 1/0 است،بیشینه مقدار تابع آگاهی حاصل از آن جایگاه محدودی دارد.به بیان دیگر، بیشینه مقدار تابع آگاهی سؤال برابر با 0/52 است.زیرا وقتی 0/5 P(?) باشد، P(?)q(?)0/25 خواهد بود.ازاین‏رو، بیشینه مقدار نظری آگاهی برای یک تست در مدل تک پارامتری برابر با حاصلضرب تعداد سؤالهای در عدد 0/52 خواهد بود.



مدل دو پارامتری

در این مدل،افزون بر جایگاه سؤال،قدرت تشخیص‏ (a) نیز برآورد می‏شود و برای خم ویژه سؤال‏ (ICC) این امکان‏ فراهم می‏آید تا برای سؤالهای مختلف،شیبهای مختلفی را به نمایش بگذارد.پارامتر تشخیص این حقیقت را آشکار می‏کند که برخی سؤالها رابطه نیرومندتر(یا ضعیف‏1تری)با سازه بنیادی مورد اندازه‏گیری(توانایی)دارند.بنابراین،مقادیر بالاتر در این پارامتر،نشان‏دهنده رابطه محکم‏تر و سختر است(تورنتون،2002).بنابر نظر هاروی و هامر(9991)قدرت‏ تشخیص از اهمیت زیادی در IRT برخوردار است.زیرا مقدار آگاهی حاصل از یک سؤال را به گونه مستقیم تعیین می‏کند. بدین ترتیب،سؤالهایی که قدرت تشخیص بیشتری دارند،در صورت برابر بودن سایر عوامل،آگاهی بیشتری درباره توانایی‏ (?) به دست می‏دهند.معادله تابع منطقی دو پارامتری به قرار زیر است: Pi(?j)1+exp]-Dai(?j-bi)[/1 


برای نمونه در ادامه مثال مربوط به مدل تک پارامتری،احتمال پاسخ درست برای سؤالی با همان درجه دشواری و قدرت تشخیص 0/5 برای فردی در سطح توانایی 0/3- (?) ،برابر با 0/21 است.در اینجا ملاحظه می‏شود که احتمال‏ پاسخ درست با احتساب قدرت تشخیص،افزایش یافته است.در مدل دو پارامتری،مانندمدل راش،دشواری سؤال‏ نقطه‏ای در مقیاس توانایی است که احتمال پاسخ درست برای افرادی که در آن سطح از توانایی هستند برابر یا 0/5 است. افزون بر این در این مدل(مانند مدل سه پارامتری)قبل از آنکه خم ویژه سؤال شیب پیدا کند،باید مقدار پارامتر تشخیص کاملا بزرگ،دست کم(1/7)باشد(بیکر،2002/1831).مقدار مثبت و بزرگ در مدل‏های راش و دو پارامتری‏ موجب می‏شود که دنباله پایین خم به صفر نزدیک گردد.



مدل پارامتری

یکی از رایج‏ترین مدلهایی که روان شناسان از آن استفاده می‏کنند مدل منطقی سه پارامتری است.این مدل در ابتدا برای‏ مدلسازی‏2داده‏های حاصل از توانایی شناختی به کار می‏رفت،اما به تازگی برای داده‏های شخصیتی نیز به کار می‏رود (امبرستون و رایس،0002).مدل سه پارامتری کلی‏تر از مدلهای تک و دو پارامتری است.گرچه مدل دو پارامتری با یکی‏ از حیاتی‏ترین ویژگیهای مدل راش،یعنی این اصل قطعی سروکار دارد که همه سؤالها از لحاظ قدرت تشخیص شبیه به‏ یکدیگرند،اما واقعیت مهم دیگری را که ممکن است در بین سؤالهای مختلف وجود داشته باشد نادیده می‏گیرد.واقعیت‏ مهمی که در اندازه‏گیریهای تستی وجود دارد این است که آزمودنیها می‏توانند پاسخ درست را از طریق حدس به دست‏ آورند.بنابراین،احتمال پاسخ درست،مؤلفه کوچکی را که ناشی از حدس است نیز دربرمی‏گیرد.هیچ یک از دو مدل خم‏ ویژه سؤال که بحث آن گذشت پدیده حدس را به حساب نمی‏آورند.


برن بام‏3(8691،نقل از بیکر،2002/1831)در مدل منطقی دو پارامتری تغییری ایجاد کرده است که برپایه آن


feeble .(1)


modeling .(2)


Birnbuam .(3)



روانشناسنان ایرانی » شماره 14 (صفحه 201)

--------------------------------------------------------------------------------


مروری بر پژوهشها


پارامتر دیگری را که بیانگر سهم حدس در احتمال پاسخ درست است نیز دربرمی‏گیرد.بنابراین،مدل سه پارامتری این‏ واقعیت را که مجانب پایین خم ویژه سؤال با احتساب حدس،ممکن است مستلزم پذیرش مقادیر غیر صفر1باشد،آشکار می‏کند(هاروی و هامر،9991).یکی از اثرات جانبی کاربرد پارامتر حدس،تغییر تعریف دشواری است.برپایه دو مدل پیشین،پارامتر b نقطه‏ای در مقیاس توانایی است که احتمال به دست آوردن پاسخ درست در آن برابر با 0/5 است. اما اکنون حد پایین خم ویژه سؤال نه عدد صفر بلکه مقدار C است.ازاین‏رو،می‏توان پارامتر C را به عنوان پایین‏ترین‏ سطح مقدار احتمال پاسخ درست تعریف کرد.بنابراین،پارامتر دشواری معرف نقطه‏ای در مقیاس توانایی است که احتمال‏ پاسخ درست آن دقیقا برابر با متوسط C و 0/1 است.


نمونه‏ای از خم ویژه و تابع آگاهی سؤال برپایه مدل سه پارامتری در شکل 1 نشان داده شده است.در این نمودار می‏توان به راحتی مشاهده کرد که چگونه پارامتری اول و دوم در متأثر از پارامتر سوم(حدس)هستند.سطح دشواری یا بتا برابر با 0/21 است.درحالی‏که پارامتر حدس برابر با 0/71 و قدرت تشخیص نیز در سطح 0/29 قرار دارد.ویژگیهای‏ این سؤال نشان می‏دهد که برای یک آزمون توانایی بسیار مناسب است.معادله تابع منطقی سه پارامتری به قرار زیر است:


(به تصویر صفحه مراجعه شود) شکل 1:نمودار خم ویژه و تابع آگاهی سؤال در مدل سه پارامتری


Pi(?j)ci+1+exp]-Dai(?j-bi)[/1-ci 


در ادامه مثالهای بالا،احتمال پاسخ درست برای سؤالی با همان مقادیر دشواری و قدرت تشخیص،که احتمال حدس‏ در آن برابر با 0/2 باشد برای فردی در سطح توانایی 0/3- (?) ،برابر با 0/592 خواهد بود.در اینجا نیز مشاهده‏ می‏شود که چگونه احتمال پاسخ درست با محاسبه پارامتر سوم(حدس)تغییر می‏کند.


در مورد کارکرد و مبانی مدل سه پارامتری بین صاحبنظران اختلاف‏نظر وجود دارد(موناهان،لی و بانکمن،7002؛ بیکر،1831/2002؛تورنتون،0002).به اعتقاد بیکر(1831/2002)تغییری که برن باوم در مدل دو پارامتری،به منظور گنجاندن عامل حدس ایجاد کرده،موجب شده است برخی از ویژگیهای خوب ریاضی تابع منطقی از دست برود و واقعیت‏ این است که مدل سه پارامتری از نظر فنی یک مدل منطقی(لوجستیک)به حساب نمی‏آید.افزون بر این در مدل سه‏ پارامتری به سبب وجود پارامتر حدس،خم ویژه تست در مقایسه با مدل دو پارامتری،با پارامترهای دشواری و قدرت تشخیص‏ یکسان،خطی‏تر و سطح کلی تابعش آگاهی آن پایین‏تر است.در شرایطی که مقادیر a و b در هر دو مدل یکسان باشد،تابع‏ آگاهی مدل دو پارامتری برابر با حد بالایی تابع آگاهی در مدل سه پارامتری خواهد بود.اما نتایج پژوهش هاسکنز و دی‏ بوئک(1002)کارکرد مدل سه پارامتری را به گونه دیگری نشان می‏دهد.به اعتقاد این پژوهشگران: برپایه مدل سه پارامتری چهار چوبی برای مدلسازی داده‏های مؤلفه‏ای‏2ارائه می‏شود که از مدلهای نظریه‏ سؤال-پاسخ برای سؤالهای چند ارزشی استفاده می‏کند.این چهار چوب دقتهای پاسخ‏3را نسبت به تکالیف‏ پیچیده شناختی،که براساس عناصر اساسی‏تر مانند ساختارهای دانش،فرایندهای شناختی و راهبردها تجزیه‏ می‏شود،مدلسازی می‏کند(ص 91). nonzero .(1)


componential data .(2)


response accuracies .(3)



روانشناسنان ایرانی » شماره 14 (صفحه 202)

--------------------------------------------------------------------------------


مروری بر پژوهشها



مدل چهار پارامتری

یکی دیگر از مدلهای کمتر شناخته شده‏ IRT ،مدل چهار پارامتری است.در این مدل افزون بر سه پارامتر a ، b و c ،پارامتر چهارم،یعنی مجانب بالای خم ویژه سؤال‏ (ū) نیز برآورد می‏شود.برپایه این مدل،احتمال عدم‏موفقیت حتی برای‏ تواناترین آزمودنیها در سؤالهای بسیار دشوار قابل ملاحظه و برآورد خواهد بود.با آنکه مدل چهارم پارامتری از لحاظ مفهومی بسیار جالب است،از لحاظ عملی مطالعات کمی در مورد آن انجام شده است.زیرا تعداد پارامترهایی که باید برای‏ آن برآورد شود بسیار زیاد است(سیجتسما و همکر،0002).در IRT مدلهای دیگری مانند مدل منطقی یک-پارامتری‏3 (OPLM) ،بتای دو جمله‏ای مرکب چهار پارامتری‏4 (4PBCB) توسعه یافته که شرح آنها در این مقاله کوتاه نمی‏گنجد. از خوانندگان علاقمند دعوت می‏شود تا برای مطالعه بیشتر به منابعی معتبر در این زمینه مانند موناهان،لی و بانکمن‏ (7002)،سیجتسما و همکر(0002)،لرد(0891)مراجعه کنند.


با آنکه مدلهای نظریه سؤال-پاسخ امکانات گسترده‏ای در اختیار تست‏سازان و روان شناسان قرار داده است،به اعتقاد برخی صاحبنظران(هاروی و هامر،9991؛تورنتون،2002)دانستن محدودیتهای آن از اهمیت زیادی برخوردار است. پژوهشگران باید همواره به یاد داشته باشند که هنگام اندازه‏گیری،در واقع در حال برازش یک مدل ریاضی با مفروضه‏ها و محدودیتهای معینی هستند و هیچ تضمینی هستند و هیچ ندارد که مدلهایی که برای یک راهبرد معین در IRT به کار می‏رود برازش کافی با داده‏ها داشته باشد.



منابع

بیکر،اف.بی.(1831).پایه‏های اساسی در تئوری سؤال پاسخ(نظریه‏های جدید روان‏سنجی).ترجمه حیدر علی هومن و علی عسگری،تهران،نشر پارسا (تاریخ انتشار اثر اصلی،2002).


Embretson,S.E. Reise,S.P.(2000).Item response theory for psychologists.Mahwah,NJ:Erlbaum. 


Hambleton.R.K.,Swaminathan,H., Rogers,H.J(1991).Fundamentals of item response theory.Newbury Park,CA:Sage Press. 


Harvey,R., Hammer,A.(1999).Item response theory.Counseling Psychologist,27,353-383. 


Hoskens,M., Deboeck,P.(2001).Multidimensional componential item response models for poly- tomous items.Applied Psychological Measurement,25,19-37. 


Lord,F.M.(1980).Applications of item response to practical testing problems.Hillsdale,NJ:Erlbaum 


Monahan,P.O.,Lee,W., Ankenmann,R.D.(2007).Generating Dichotomous Item Scores with the Four- Parameter Beta Compound Binomial Model.Journal of Educational Measurement,44,211-225. 


Sijtsma,k., Hemker,B.T.(2000).A taxonomy of IRT models for ordering persons.Journal of Educational and Behavioral Statistics,25,391-415. 


Thornton,A.(2002).Aprimer on 2-and3-parameter item response theory models.Paper presented in Annual Meeting of the College of Education,University of North Texas(2nd,Denton,TX,February 1). 


Thissen,D. Orlando,M.(2001).Item response theory scored in two categories.In D.Thissen Wainer,H.(Eds.),Test scoring(pp.73-140).Mahwah,NJ:Lawrence Erlbaum Associates,Inc. 


Wright,B.D.(1992).IRT in the 1990s:Which models work best?Rasch Measurement Transactions,6(1),196-200 


One-Parameter Logistic Model .(1)


Four Parameter Beta Compound Binomial .(2)



پایان مقاله