مروری بر پژوهشها: روی آوردهای نوین در روان سنجی (قسمت چهارم) مدلهای نظریه سؤال - پاسخ، مدلهای ارزشی
URL : http://www.noormags.com/view/fa/ArticlePage/324567
عنوان مقاله: مروری بر پژوهشها: روی آوردهای نوین در روان سنجی (قسمت چهارم) مدلهای نظریه سؤال - پاسخ، مدلهای ارزشی (4 صفحه)
نویسنده : عسگری، علی
چکیده :
کلمات کلیدی :
روانشناسنان ایرانی » شماره 14 (صفحه 199)
--------------------------------------------------------------------------------
مروری بر پژوهشها رویآوردهای نوین در روانسنجی قسمت چهارم:مدلهای نظریه سؤال-پاسخ،مدلهای دو ارزشی
New Approaches to Psychometrics Part Four:Models of Item Response Theory,Dichotomous Models Ali Asgari,PhD University of Welfare and Rehabilitation
برای بررسی دادههای دو ارزشی مدلهای متعددی در IRT وجود دارد.اما انتخاب یک مدل باید برپایه ملاحظات نظری و تجربی،مانند برازش داده-مدل1صورت گیرد.هر مدل با استفاده از ارزش عددی یک یا چند پارامتر،خم ویژه بخصوصی را معین میکند و از لحاظ انتقال اطلاعات درباره ویژگیهای فنی سؤالها ابزار مفیدی به شمار میآید(بیکر،2002/1831). به منظور محاسبه احتمال پاسخ درست در سطوح مختلف توانایی،هریک از مدلها از یک معادله ریاضی استفاده میکنند.
به گونه کلی،مدلهای IRT را میتوان به دو خانواده مدلهای تکبعدی2و چندبعدی3تقسیم کرد(تیسن و اورلاندو، 1002،رایت،2991).مدلهای تکبعدی مستلزم تنها یک بعد واحد از خصیصه(توانایی)است.درحالیکه،در مدلهای چندبعدی فرض بر آن است که دادهها از خصایص چند وجهی یا چندگانه به دست می آیند.باوجوداین،به دلیل پیچیدگی فزاینده مدلهای چندبعدی،در بیشتر پژوهشها و کاربردهای IRT از مدلهای تکبعدی استفاده میشود.
افزون بر این،مدلهای IRT برپایه تعداد پاسخهای نمرهگذاری شده نیز طبقهبندی میشود.یک سؤال چند گزینهای در واقع یک مدل دو ارزشی است حتی اگر دارای چهار یا پنج گزینه باشد.زیرا فقط بهگونه درست/نادرست(صحیح/غلط) نمرهگذاری میشود.طبقه دیگر مدلها،برای دادههای چند ارزشی به کار میروند که در آن مقدار نمره هر پاسخ متفاوت است.برای نمونه،چنانکه در قسمت قبل بیان شد،مدل چند ارزشی راش در واقع تعمیم این مدل به دادههای مربوط به دو یا چند طبقه مرتب شده است.مدلهای دو ارزشی IRT را میتون برپایه تعداد پارامترهایی که در آنها به کار میرود نیز توصیف کرد.بدین ترتیب،در مدل سه پارامتری،هر سه پارامتر دشواری( b ،جایگاه سؤال)،قدرت تشخیص( a ،شیب سؤال)و حدس( c ،مجانب5پایین خم ویژه)به کار میروند.درحالیکه در مدل دو پارامتری فرض بر این است که دادهها کمینه حدس را دارند اما براساس جایگاه و قدرت تشخیص سؤال متغیرند،و سرانجام در مدل تک پارامتری مقدار حدس و قدرت تشخیص سؤالها برابر فرض میشوند و تنها جایگاه سؤال برآورد میشود.افزون بر این،از لحاظ نظری یک مدل چهار پارامتری نیز وجود دارد که پارامتر چهارم آن مجانب بالایی خم ویژه است.اما این مدل بهندرت به کار برده میشود (هامبلتون و سوامیناتان،1991؛تیسن و اورلاندو،1002).
مدل پارامتری
مدل منطقی تک پارامتری سادهترین مدل IRT است و همانگونه که از نام آن پیداست برای کاربرد نظریه سؤال-پاسخ تنها برآورد یک پارامتر،یعنی درجه دشواری (b) ،برای آن لازم است.برپایه این مدل،پارامتر قدرت تشخیص برای همه سؤالها ثابت و برابر با 1/0 قرار داده میشود؛یعنی تنها پارامتر دشواری میتواند مقادیر مختلفی اختیار کند.معادله این مدل به قرار زیر است: Pi(?)1+e-(?-bi)/1
که در آن: p(?) احتمال پاسخ درست برای سطح معینی از توانایی، e برابر با 2/817، -(?-b) انحراف منطقی است. model-data fit .(1)
unidimensional .(2)
multidimensional .(3)
multiple .(4)
asymptote .(5)
روانشناسنان ایرانی » شماره 14 (صفحه 200)
--------------------------------------------------------------------------------
مروری بر پژوهشها
برای نمونه،برپایه فرمول بالا،احتمال پاسخ درست به سؤالی با درجه دشواری 1/0 برای فردی که در سطح توانایی (?)-/3 قرار دارد،برابر با 0/20 خواهد بود.چون مقدار پارامتر تشخیص در معادله بالا که همواره برابر با 0/1 است، معمولا در فرمول نشان داده نمیشود.بنابر نظر هاروی و هامر(9991)،تک پارامتر،از لحاظ اجرایی،به نمرهای از توانایی اطلاق میشود که با احتمال 05 درصدی پاسخ به یک سؤال انشایی سروکار دارد.چون مقدار پارامتر قدرت تشخیص در مدل راش برابر با مقدار ثابت 1/0 است،بیشینه مقدار تابع آگاهی حاصل از آن جایگاه محدودی دارد.به بیان دیگر، بیشینه مقدار تابع آگاهی سؤال برابر با 0/52 است.زیرا وقتی 0/5 P(?) باشد، P(?)q(?)0/25 خواهد بود.ازاینرو، بیشینه مقدار نظری آگاهی برای یک تست در مدل تک پارامتری برابر با حاصلضرب تعداد سؤالهای در عدد 0/52 خواهد بود.
مدل دو پارامتری
در این مدل،افزون بر جایگاه سؤال،قدرت تشخیص (a) نیز برآورد میشود و برای خم ویژه سؤال (ICC) این امکان فراهم میآید تا برای سؤالهای مختلف،شیبهای مختلفی را به نمایش بگذارد.پارامتر تشخیص این حقیقت را آشکار میکند که برخی سؤالها رابطه نیرومندتر(یا ضعیف1تری)با سازه بنیادی مورد اندازهگیری(توانایی)دارند.بنابراین،مقادیر بالاتر در این پارامتر،نشاندهنده رابطه محکمتر و سختر است(تورنتون،2002).بنابر نظر هاروی و هامر(9991)قدرت تشخیص از اهمیت زیادی در IRT برخوردار است.زیرا مقدار آگاهی حاصل از یک سؤال را به گونه مستقیم تعیین میکند. بدین ترتیب،سؤالهایی که قدرت تشخیص بیشتری دارند،در صورت برابر بودن سایر عوامل،آگاهی بیشتری درباره توانایی (?) به دست میدهند.معادله تابع منطقی دو پارامتری به قرار زیر است: Pi(?j)1+exp]-Dai(?j-bi)[/1
برای نمونه در ادامه مثال مربوط به مدل تک پارامتری،احتمال پاسخ درست برای سؤالی با همان درجه دشواری و قدرت تشخیص 0/5 برای فردی در سطح توانایی 0/3- (?) ،برابر با 0/21 است.در اینجا ملاحظه میشود که احتمال پاسخ درست با احتساب قدرت تشخیص،افزایش یافته است.در مدل دو پارامتری،مانندمدل راش،دشواری سؤال نقطهای در مقیاس توانایی است که احتمال پاسخ درست برای افرادی که در آن سطح از توانایی هستند برابر یا 0/5 است. افزون بر این در این مدل(مانند مدل سه پارامتری)قبل از آنکه خم ویژه سؤال شیب پیدا کند،باید مقدار پارامتر تشخیص کاملا بزرگ،دست کم(1/7)باشد(بیکر،2002/1831).مقدار مثبت و بزرگ در مدلهای راش و دو پارامتری موجب میشود که دنباله پایین خم به صفر نزدیک گردد.
مدل پارامتری
یکی از رایجترین مدلهایی که روان شناسان از آن استفاده میکنند مدل منطقی سه پارامتری است.این مدل در ابتدا برای مدلسازی2دادههای حاصل از توانایی شناختی به کار میرفت،اما به تازگی برای دادههای شخصیتی نیز به کار میرود (امبرستون و رایس،0002).مدل سه پارامتری کلیتر از مدلهای تک و دو پارامتری است.گرچه مدل دو پارامتری با یکی از حیاتیترین ویژگیهای مدل راش،یعنی این اصل قطعی سروکار دارد که همه سؤالها از لحاظ قدرت تشخیص شبیه به یکدیگرند،اما واقعیت مهم دیگری را که ممکن است در بین سؤالهای مختلف وجود داشته باشد نادیده میگیرد.واقعیت مهمی که در اندازهگیریهای تستی وجود دارد این است که آزمودنیها میتوانند پاسخ درست را از طریق حدس به دست آورند.بنابراین،احتمال پاسخ درست،مؤلفه کوچکی را که ناشی از حدس است نیز دربرمیگیرد.هیچ یک از دو مدل خم ویژه سؤال که بحث آن گذشت پدیده حدس را به حساب نمیآورند.
برن بام3(8691،نقل از بیکر،2002/1831)در مدل منطقی دو پارامتری تغییری ایجاد کرده است که برپایه آن
feeble .(1)
modeling .(2)
Birnbuam .(3)
روانشناسنان ایرانی » شماره 14 (صفحه 201)
--------------------------------------------------------------------------------
مروری بر پژوهشها
پارامتر دیگری را که بیانگر سهم حدس در احتمال پاسخ درست است نیز دربرمیگیرد.بنابراین،مدل سه پارامتری این واقعیت را که مجانب پایین خم ویژه سؤال با احتساب حدس،ممکن است مستلزم پذیرش مقادیر غیر صفر1باشد،آشکار میکند(هاروی و هامر،9991).یکی از اثرات جانبی کاربرد پارامتر حدس،تغییر تعریف دشواری است.برپایه دو مدل پیشین،پارامتر b نقطهای در مقیاس توانایی است که احتمال به دست آوردن پاسخ درست در آن برابر با 0/5 است. اما اکنون حد پایین خم ویژه سؤال نه عدد صفر بلکه مقدار C است.ازاینرو،میتوان پارامتر C را به عنوان پایینترین سطح مقدار احتمال پاسخ درست تعریف کرد.بنابراین،پارامتر دشواری معرف نقطهای در مقیاس توانایی است که احتمال پاسخ درست آن دقیقا برابر با متوسط C و 0/1 است.
نمونهای از خم ویژه و تابع آگاهی سؤال برپایه مدل سه پارامتری در شکل 1 نشان داده شده است.در این نمودار میتوان به راحتی مشاهده کرد که چگونه پارامتری اول و دوم در متأثر از پارامتر سوم(حدس)هستند.سطح دشواری یا بتا برابر با 0/21 است.درحالیکه پارامتر حدس برابر با 0/71 و قدرت تشخیص نیز در سطح 0/29 قرار دارد.ویژگیهای این سؤال نشان میدهد که برای یک آزمون توانایی بسیار مناسب است.معادله تابع منطقی سه پارامتری به قرار زیر است:
(به تصویر صفحه مراجعه شود) شکل 1:نمودار خم ویژه و تابع آگاهی سؤال در مدل سه پارامتری
Pi(?j)ci+1+exp]-Dai(?j-bi)[/1-ci
در ادامه مثالهای بالا،احتمال پاسخ درست برای سؤالی با همان مقادیر دشواری و قدرت تشخیص،که احتمال حدس در آن برابر با 0/2 باشد برای فردی در سطح توانایی 0/3- (?) ،برابر با 0/592 خواهد بود.در اینجا نیز مشاهده میشود که چگونه احتمال پاسخ درست با محاسبه پارامتر سوم(حدس)تغییر میکند.
در مورد کارکرد و مبانی مدل سه پارامتری بین صاحبنظران اختلافنظر وجود دارد(موناهان،لی و بانکمن،7002؛ بیکر،1831/2002؛تورنتون،0002).به اعتقاد بیکر(1831/2002)تغییری که برن باوم در مدل دو پارامتری،به منظور گنجاندن عامل حدس ایجاد کرده،موجب شده است برخی از ویژگیهای خوب ریاضی تابع منطقی از دست برود و واقعیت این است که مدل سه پارامتری از نظر فنی یک مدل منطقی(لوجستیک)به حساب نمیآید.افزون بر این در مدل سه پارامتری به سبب وجود پارامتر حدس،خم ویژه تست در مقایسه با مدل دو پارامتری،با پارامترهای دشواری و قدرت تشخیص یکسان،خطیتر و سطح کلی تابعش آگاهی آن پایینتر است.در شرایطی که مقادیر a و b در هر دو مدل یکسان باشد،تابع آگاهی مدل دو پارامتری برابر با حد بالایی تابع آگاهی در مدل سه پارامتری خواهد بود.اما نتایج پژوهش هاسکنز و دی بوئک(1002)کارکرد مدل سه پارامتری را به گونه دیگری نشان میدهد.به اعتقاد این پژوهشگران: برپایه مدل سه پارامتری چهار چوبی برای مدلسازی دادههای مؤلفهای2ارائه میشود که از مدلهای نظریه سؤال-پاسخ برای سؤالهای چند ارزشی استفاده میکند.این چهار چوب دقتهای پاسخ3را نسبت به تکالیف پیچیده شناختی،که براساس عناصر اساسیتر مانند ساختارهای دانش،فرایندهای شناختی و راهبردها تجزیه میشود،مدلسازی میکند(ص 91). nonzero .(1)
componential data .(2)
response accuracies .(3)
روانشناسنان ایرانی » شماره 14 (صفحه 202)
--------------------------------------------------------------------------------
مروری بر پژوهشها
مدل چهار پارامتری
یکی دیگر از مدلهای کمتر شناخته شده IRT ،مدل چهار پارامتری است.در این مدل افزون بر سه پارامتر a ، b و c ،پارامتر چهارم،یعنی مجانب بالای خم ویژه سؤال (ū) نیز برآورد میشود.برپایه این مدل،احتمال عدمموفقیت حتی برای تواناترین آزمودنیها در سؤالهای بسیار دشوار قابل ملاحظه و برآورد خواهد بود.با آنکه مدل چهارم پارامتری از لحاظ مفهومی بسیار جالب است،از لحاظ عملی مطالعات کمی در مورد آن انجام شده است.زیرا تعداد پارامترهایی که باید برای آن برآورد شود بسیار زیاد است(سیجتسما و همکر،0002).در IRT مدلهای دیگری مانند مدل منطقی یک-پارامتری3 (OPLM) ،بتای دو جملهای مرکب چهار پارامتری4 (4PBCB) توسعه یافته که شرح آنها در این مقاله کوتاه نمیگنجد. از خوانندگان علاقمند دعوت میشود تا برای مطالعه بیشتر به منابعی معتبر در این زمینه مانند موناهان،لی و بانکمن (7002)،سیجتسما و همکر(0002)،لرد(0891)مراجعه کنند.
با آنکه مدلهای نظریه سؤال-پاسخ امکانات گستردهای در اختیار تستسازان و روان شناسان قرار داده است،به اعتقاد برخی صاحبنظران(هاروی و هامر،9991؛تورنتون،2002)دانستن محدودیتهای آن از اهمیت زیادی برخوردار است. پژوهشگران باید همواره به یاد داشته باشند که هنگام اندازهگیری،در واقع در حال برازش یک مدل ریاضی با مفروضهها و محدودیتهای معینی هستند و هیچ تضمینی هستند و هیچ ندارد که مدلهایی که برای یک راهبرد معین در IRT به کار میرود برازش کافی با دادهها داشته باشد.
منابع
بیکر،اف.بی.(1831).پایههای اساسی در تئوری سؤال پاسخ(نظریههای جدید روانسنجی).ترجمه حیدر علی هومن و علی عسگری،تهران،نشر پارسا (تاریخ انتشار اثر اصلی،2002).
Embretson,S.E. Reise,S.P.(2000).Item response theory for psychologists.Mahwah,NJ:Erlbaum.
Hambleton.R.K.,Swaminathan,H., Rogers,H.J(1991).Fundamentals of item response theory.Newbury Park,CA:Sage Press.
Harvey,R., Hammer,A.(1999).Item response theory.Counseling Psychologist,27,353-383.
Hoskens,M., Deboeck,P.(2001).Multidimensional componential item response models for poly- tomous items.Applied Psychological Measurement,25,19-37.
Lord,F.M.(1980).Applications of item response to practical testing problems.Hillsdale,NJ:Erlbaum
Monahan,P.O.,Lee,W., Ankenmann,R.D.(2007).Generating Dichotomous Item Scores with the Four- Parameter Beta Compound Binomial Model.Journal of Educational Measurement,44,211-225.
Sijtsma,k., Hemker,B.T.(2000).A taxonomy of IRT models for ordering persons.Journal of Educational and Behavioral Statistics,25,391-415.
Thornton,A.(2002).Aprimer on 2-and3-parameter item response theory models.Paper presented in Annual Meeting of the College of Education,University of North Texas(2nd,Denton,TX,February 1).
Thissen,D. Orlando,M.(2001).Item response theory scored in two categories.In D.Thissen Wainer,H.(Eds.),Test scoring(pp.73-140).Mahwah,NJ:Lawrence Erlbaum Associates,Inc.
Wright,B.D.(1992).IRT in the 1990s:Which models work best?Rasch Measurement Transactions,6(1),196-200
One-Parameter Logistic Model .(1)
Four Parameter Beta Compound Binomial .(2)
پایان مقاله