ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆالـ ﭘﺎﺳﺦ از ﻧﻈﺮ وﯾﮋﮔﯽﻫﺎی ﺳﺆال
Archive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ
ﺳﺆالـ ﭘﺎﺳﺦ از ﻧﻈﺮ وﯾﮋﮔﯽﻫﺎی ﺳﺆال
دﮐﺘﺮ ﻋﻠﯽ دﻻور
∗
ﻋﻠﯽ ﻣﻘﺪم زاده
∗∗
ﺳﯿﺪه ﻃﯿﺒﻪ ﻣﻄﯿﻌﯽ ﻟﻨﮕﺮودی
∗∗∗
ﭼﮑﯿﺪه
ﻫﺪف ﭘﮋوﻫﺶ ﺣﺎﺿﺮ، ﻣﻘﺎﯾﺴﻪ دو ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی و ﻣﺪل
ﺳﺆال ـ ﭘﺎﺳﺦ ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ از ﻧﻈﺮ وﯾﮋﮔﯽﻫﺎی ﺳﺆال ﺑﻮده اﺳﺖ. روش ﺗﺤﻘﯿﻖ از ﻧﻮع
ﮐﺎرﺑﺮدی ـ ﺗﻮﺻﯿﻔﯽ ﺑﻮده و ﺑﺮای دﺳﺘﯿﺎﺑﯽ ﺑﻪ اﯾﻦ ﻫﺪف، ﭘﮋوﻫﺶ ﺗﻮﺻﯿﻔﯽ اﻧﺠﺎم ﺷﺪه اﺳﺖ.
در ﺑﺮرﺳﯽ ﻋﻤﻠﯽ، ﺑﺮای آزﻣﻮن اﺧﺘﺼﺎﺻﯽ رﯾﺎﺿﯽ، از ﭘﺎﺳﺨﻨﺎﻣﻪﻫﺎی داوﻃﻠﺒﺎن رﺷﺘﻪ رﯾﺎﺿﯽ ـ
ﻓﯿﺰﯾﮏ در آزﻣﻮن ورودی داﻧﺸﮕﺎهﻫﺎی ﮐﺸﻮر در ﺳﺎل 1384 اﺳﺘﻔﺎده ﺷﺪ. از ﺑﯿﻦ ﮐﻠﯿﻪ
داوﻃﻠﺒﺎن رﺷﺘﻪ رﯾﺎﺿﯽ ـ ﻓﯿﺰﯾﮏ ﺷﺮﮐﺖﮐﻨﻨﺪه در آزﻣﻮن ﺳﺎل 1384، ﺑﻪ روش ﻧﻤﻮﻧﻪﮔﯿﺮی
ﺳﯿﺴﺘﻤﺎﺗﯿﮏ، ﯾﮏ ﮔﺮوه ﻧﻤﻮﻧﻪ 3000 ﻧﻔﺮی اﻧﺘﺨﺎب ﺷﺪ و ﺳﻪ ﺳﺆال اﯾﻦ ﭘﮋوﻫﺶ، ﻣﻮرد ﺑﺮرﺳﯽ
ﻗﺮار ﮔﺮﻓﺖ. ﺑﺮای ﺗﺤﻠﯿﻞ دادهﻫﺎ از روشﻫﺎی آﻣﺎری ﻣﻮرد اﺳﺘﻔﺎده در ﻣﺪل ﮐﻼﺳﯿﮏ (ﺷﺎﻣﻞ
ﻣﯿﺎﻧﮕﯿﻦ ﯾﺎ درﺟﻪ دﺷﻮاری ﺳﺆاﻻت، وارﯾﺎﻧﺲ ﺳﺆاﻻت و ﻫﻤﺒﺴﺘﮕﯽ دورﺷﺘﻪای) اﺳﺘﻔﺎده ﺷﺪ.
ﺑﺮای ﺗﺤﻠﯿﻞ دادهﻫﺎ در ﻧﻈﺮﯾﻪ ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، از روش آزﻣﻮن t واﺑﺴﺘﻪ، ﺿﺮﯾﺐ
ﻫﻤﺒﺴﺘﮕﯽ و آزﻣﻮن ﻣﻌﻨﯽداری اﺳﺘﻔﺎده ﺷﺪ. ﻧﺘﺎﯾﺞ ﺗﺤﻘﯿﻖ ﻧﺸﺎن داد ﮐﻪ ﭘﺎراﻣﺘﺮﻫﺎی ﻣﺤﺎﺳﺒﻪ
ﺷﺪه ﺳﺆال در ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، ﺑﺮﻋﮑﺲ ﻣﺪل ﮐﻼﺳﯿﮏ، واﺑﺴﺘﻪ ﺑﻪ ﺳﺆال
∗ اﺳﺘﺎد داﻧﺸﮑﺪه روان ﺷﻨﺎﺳﯽ و ﻋﻠﻮمﺗﺮﺑﯿﺘﯽ داﻧﺸﮕﺎه ﻋﻼﻣﻪﻃﺒﺎﻃﺒﺎﯾﯽ_(delavarali@yahoo.com)
∗∗ ﮐﺎرﺷﻨﺎس ارﺷﺪ ﺳﻨﺠﺶ و اﻧﺪازهﮔﯿﺮی داﻧﺸﮕﺎه ﻋﻼﻣﻪﻃﺒﺎﻃﺒﺎﯾﯽ و دﻓﺘﺮ آزﻣﻮنﺳﺎزی و روانﺳﻨﺠﯽ ﺳﺎزﻣﺎن ﺳﻨﺠﺶ آﻣﻮزش
(Irsoyali_s2000@yahoo.com )ﮐﺸﻮر
∗∗∗ ﮐﺎرﺷﻨﺎس ارﺷﺪ ﺗﺤﻘﯿﻘﺎت آﻣﻮزﺷﯽ داﻧﺸﮕﺎه ﺗﻬﺮان و دﻓﺘﺮ آزﻣﻮنﺳﺎزی و روانﺳﻨﺠﯽ ﺳﺎزﻣﺎن ﺳـﻨﺠﺶ آﻣـﻮزش ﮐـﺸﻮر (
(stml90@yahoo.com
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
42
اﺳﺖ ﻧﻪ ﺑﻪ آزﻣﻮدﻧﯽ. ﺑﻨﺎﺑﺮاﯾﻦ، ﻣﯽﺗﻮان ﻧﺘﯿﺠﻪ ﮔﺮﻓﺖ ﮐﻪ ﻧﻈﺮﯾﻪ ﺳﺆال ـ ﭘﺎﺳﺦ ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ،
ﻫﻢ از ﻟﺤﺎظ ﻧﻈﺮی و ﻫﻢ از ﻟﺤﺎظ ﻋﻤﻠﯽ ﺑﺮ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ ﻣﺰﯾﺖ و ﺑﺮﺗﺮی دارد.
ﮐﻠﯿﺪ واژﮔﺎن: ﻣﺪل ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی، ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، وﯾﮋﮔﯽﻫﺎی ﺳﺆال.
ﻣﻘﺪﻣﻪ
ﺑﻪﻗﻮل ﺛﺮﻧﺪاﯾﮏ
1
(1982) ﺗﺎرﯾﺦ اﻧﺪازهﮔﯿﺮیﻫﺎی رواﻧﯽ و ﺗﺮﺑﯿﺘﯽ در ﻗﺮن ﺑﯿﺴﺘﻢ ، در واﻗﻊ
ﺗﺎرﯾﺦ ﮐﺸﻒ و اﺧﺘﺮاع اﺑﺰارﻫﺎ و روشﻫﺎی اﻧﺪازهﮔﯿﺮی اﺳﺖ ﮐﻪ ﺑﻪ ﻃﺮﯾﻘﯽ اﺳﺘﺎﻧﺪارد و ﺗﺤﺖ ﺷﺮاﯾﻂ
ﯾﮑﺴﺎن، رﻓﺘﺎرﻫﺎﯾﯽ را ﮐﻪ ﻣﻨﻌﮑﺲ ﮐﻨﻨﺪه ﺧﺼﯿﺼﻪﻫﺎی اﻓﺮاد اﺳﺖ، آﺷﮑﺎر ﻣﯽﮐﻨﺪ و ﻣﻮرد ﺳﻨﺠﺶ
ﻗﺮار ﻣﯽدﻫﺪ. اراﺋﻪ ﻧﻈﺮﯾﻪﻫﺎی ﻧﻮﯾﻦ اﻧﺪازهﮔﯿﺮی در ﻗﺮن ﺣﺎﺿﺮ، ﺑﻪ ﭘﯿﺸﺮﻓﺖ ﻓﻨﻮن و اﺑﺰارﻫﺎی
اﺳﺘﺎﻧﺪارد ﺷﺪهای اﻧﺠﺎﻣﯿﺪه اﺳﺖ ﮐﻪ اﻧﺪازهﮔﯿﺮی و ﺗﺒﺪﯾﻞ ﺗﻮاﻧﺶﻫﺎی ﻓﺮدی ﺑﻪ ﻣﻘﯿﺎسﻫﺎی ﻗﺎﺑﻞ ﻗﺒﻮل
ﺑﺮای ﺗﻮﺻﯿﻒ، ﺗﻔﺴﯿﺮ و ﺑﺮآورد ﺗﻔﺎوتﻫﺎی ﻓﺮدی را اﻣﮑﺎنﭘﺬﯾﺮ ﻣﯽﺳﺎزد (اﻓﺮوز و ﻫﻮﻣﻦ، 1375).
ﺗﻼشﻫﺎی ﻧﺨﺴﺘﯿﻦ ﺑﺮای ﺗﮑﻮﯾﻦ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی
2
در دﻫﻪ 1890 آﻏﺎز ﺷﺪ. اﯾﻦ ﻧﻈﺮﯾﻪ، از
روشﻫﺎی دﯾﺮﯾﻨﻪ ﺑﺮای ﺳﺎﺧﺖ و ﺗﻮﺳﻌﻪ آزﻣﻮنﻫﺎ در ﺣﻮزه ﻋﻠﻮم اﻧﺴﺎﻧﯽ اﺳﺖ ﮐﻪ از اواﯾﻞ دﻫﻪ
1900 ﺑﺮای ﺗﻮﺳﻌﻪ اﺑﺰارﻫﺎی اﻧﺪازهﮔﯿﺮی و ﺗﻌﯿﯿﻦ ﻣﯿﺰان ﻫﻤﺨﻮاﻧﯽ آزﻣﻮنﻫﺎ ﺑﺎ ﻧﻈﺮﯾﻪ و ﻧﻤﺮهﮔﺬاری
اﻣﺘﺤﺎﻧﺎت اﺳﺘﻔﺎده ﺷﺪه اﺳﺖ. اوج ﺗﮑﺎﻣﻞ اﯾﻦ ﻧﻈﺮﯾﻪ را ﺑﻌﺪ از اﺳﭙﯿﺮﻣﻦ
3
، ﻣﯽﺗﻮان در دو ﮐﺘﺎب: (1)
«ﻣﺒﺎﻧﯽ ﻧﻈﺮی آزﻣﻮنﻫﺎی رواﻧﯽ
4
» ﮔﺎﻟﯿﮑﺴﻦ
5
(1950) و «ﺗﺌﻮریﻫﺎی آﻣﺎری ﻧﻤﺮات آزﻣﻮنﻫﺎی
رواﻧﯽ
6
ﻟﺮد و ﻧﺎوﯾﮏ
7
(1968) ﻣﺸﺎﻫﺪه ﮐﺮد (ﻫﻤﺒﻠﺘﻮن و واﻧﺪر ﻟﯿﻨﺪن
8
.(1982 ،
ﮔﺮﭼﻪ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی ﻣﺪت زﻣﺎن ﻃﻮﻻﻧﯽ ﺑﻪ ﺟﺎﻣﻌﻪ روان ﺳﻨﺠﯽ ﺧﺪﻣﺖ ﮐﺮده
اﺳﺖ؛ اﻣﺎ ﺑﺮﺧﯽ ﻣﻄﺎﻟﻌﺎت، ﻣﺤﺪودﯾﺖﻫﺎﯾﯽ را در اﯾﻦ ﻧﻈﺮﯾﻪ (از ﺟﻤﻠﻪ ﮔﺎﻟﯿﮑﺴﻦ، 1950؛ ﻟﺮد و
ﻧﺎوﯾﮏ، 1968؛ ﻫﻤﺒﻠﺘﻮن و ﺳﻮاﻣﯿﻨﺎﺗﺎن و راﺟﺮز
9
، 1991 ) و در آزﻣﻮنﻫﺎی ﺳﺎﺧﺘﻪ ﺷﺪه ﺑﺮ اﺳﺎس آن
ﻧﺸﺎن ﻣﯽدﻫﺪ (رک: ﻟﺮد، 1980 و ﻫﻤﺒﻠﺘﻮن، 1989).
زﻣﯿﻨﻪ اراﺋﻪ ﻧﻈﺮﯾﻪﻫﺎی ﺟﺪﯾﺪ اﻧﺪازهﮔﯿﺮی، از اواﯾﻞ ﻧﯿﻤﻪ دوم ﻗﺮن ﺑﯿﺴﺘﻢ و ﺑﻪ وﺳﯿﻠﻪ اﻓﺮادی
ﭼﻮن ﻟﺮد (در ﺳﺎلﻫﺎی 1952ﺗﺎ 1953 )، راش
10
(1958 ﺗﺎ 1968 )، راﯾﺖ
11
(1968)، ﻫﻤﺒﻠﺘﻮن
(1979 و 1983) و ... ﻓﺮاﻫﻢ ﺷﺪ. ﻧﻈﺮﯾﺎت ﺟﺪﯾﺪ اﻧﺪازهﮔﯿﺮی، ﭼﻪ از ﻟﺤﺎظ روشﻫﺎی آﻣﺎری و ﺑﻪ
ﮐﺎرﮔﯿﺮی ﺗﻮاﺑﻊ و ﻣﺪلﻫﺎی رﯾﺎﺿﯽ و ﭼﻪ از ﺟﻬﺖ ﻣﻔﺮوﺿﻪﻫﺎی ﻧﻈﺮی و ﻧﺘﺎﯾﺞ ﮐﺎرﺑﺮدی، ﺗﻔﺎوتﻫﺎی
ﭼﺸﻤﮕﯿﺮی ﺑﺎ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی دارد. اﯾﻦ ﻧﻈﺮﯾﻪ در دﻫﻪ 1950 ﺑﻪﻋﻨﻮان ﯾﮏ ﺟﺎﯾﮕﺰﯾﻦ
ﺑﺮای ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی ﻣﻌﺮﻓﯽ ﺷﺪ.
1. Thorndike 2. classical test theory (CTT) 3. Spearman
4. theory of mental tests 5. Gulliksen
6. statistical theories of mental test scores 7. Lord & Novick
8. Hambleton & Vander Linden 9. Ragerz
10. Rasch 11. Wright
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 43
ﻧﻈﺮﯾﻪ ﺳﺆال- ﭘﺎﺳﺦ، ﯾﮏ ﻧﻈﺮﯾﻪ ﺟـﺎﻣﻊ آﻣـﺎری درﺑـﺎره ﻋﻤﻠﮑـﺮد ﺳـﺆال آزﻣـﻮن و آزﻣـﻮدﻧﯽ و
ﭼﮕﻮﻧﮕﯽ ﺳﻨﺠﺶ ﺗﻮاﻧﺎﯾﯽﻫﺎﯾﯽ اﺳﺖ. ﻣﻘﯿﺎس ﺳﺆال – ﭘﺎﺳﺦﻫﺎ ﻣﯽﺗﻮاﻧﺪ ﮔﺴﺴﺘﻪ ﯾﺎ ﭘﯿﻮﺳﺘﻪ ﺑﺎﺷﺪ؛ ﻣـﯽ
ﺗﻮاﻧﺪ دوارزﺷﯽ و ﯾﺎ ﭼﻨﺪارزﺷﯽ ﻧﻤﺮهﮔﺬاری ﺷﻮد؛ ﻃﺒﻘﺎت ﻧﻤﺮه ﺳﺆال ﻣﯽﺗﻮاﻧـﺪ ﻣـﻨﻈﻢ و ﯾـﺎ ﻧـﺎﻣﻨﻈﻢ
ﺑﺎﺷﺪ؛ ﯾﮏ ﺗﻮاﻧﺎﯾﯽ ﯾﺎ ﭼﻨﺪ ﺗﻮاﻧﺎﯾﯽ ﻣـﯽﺗﻮاﻧـﺪ در آزﻣـﻮن ﻣـﺴﺘﺘﺮ ﺑﺎﺷـﺪ؛ ﻫـﻢﭼﻨـﯿﻦ در ارﺗﺒـﺎط ﺑـﯿﻦ
ﺳﺆال – ﭘﺎﺳﺦﻫﺎ و ﺗﻮاﻧﺎﯾﯽ ﯾﺎ ﺗﻮاﻧﺎﯾﯽﻫﺎﯾﯽ ﮐﻪ ﻣﯽﺗﻮاﻧﺪ ﻣﺸﺨﺺ ﺷﻮد، ﭼﻨﺪ روش (ﯾﺎ ﻣـﺪل) وﺟـﻮد
دارد (ﻫﻤﺒﻠﺘﻮن و ﺟﻮﻧﺰ
1
.( 1993 ،
اﯾﻦ ﻧﻈﺮﯾﻪ ﺑﺮ ﻧﻈﺮﯾﻪ ﯾﺎ اﻟﮕﻮی ﺻﻔﺖ ﻣﮑﻨﻮن اﺳﺘﻮار اﺳﺖ. ﻧﻈﺮﯾﻪ ﺳـﺆال- ﭘﺎﺳـﺦ ﺑـﺎ اﺳـﺘﻔﺎده از
ﻣﺪلﻫﺎی رﯾﺎﺿﯽ ﭘﯿﭽﯿﺪهﺗﺮ از آﻧﭽﻪ در ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی ﺑﻪﮐﺎر ﻣﯽرود، ﯾﮏ ﺗـﺎﺑﻊ رﯾﺎﺿـﯽ
ﺑﻪدﺳﺖ ﻣﯽدﻫﺪ ﮐﻪ ﺑﺎ اﺳﺘﻔﺎده از آن ﻣﯽﺗﻮان اﺣﺘﻤﺎل ﭘﺎﺳﺦ درﺳﺖ ﺑﻪ ﯾﮏ ﺳﺆال آزﻣـﻮن را ﺑـﻪﻋﻨـﻮان
ﺗﺎﺑﻌﯽ از «ﺗﻮاﻧﺎﯾﯽ
2
» آزﻣﻮدﻧﯽ و ﻫﻢﭼﻨﯿﻦ ﺑﺮﺧﯽ وﯾﮋﮔﯽﻫﺎی ﺳﺆال ﻣﻌﺮﻓﯽ ﮐﺮد. ﺑـﻪ ﺳـﺨﻦ دﯾﮕـﺮ، در
ﻧﻈﺮﯾﻪ ﺳﺆال – ﭘﺎﺳﺦ، ﻓﺮض ﺑﺮ اﯾﻦ اﺳﺖ ﮐﻪ ً ﻣﺜﻼ اﺣﺘﻤﺎل ﭘﺎﺳﺦ درﺳﺖ دادن ﺑﻪ ﯾﮏ ﺳـﺆال ﺟﺒـﺮ ﺑـﺎ
اﻓﺰاﯾﺶ داﻧﺶ ﺟﺒﺮ آزﻣﻮدﻧﯽ اﻓﺰاﯾﺶ ﻣﯽﯾﺎﺑﺪ و اﯾﻦ، ﺑﺎﻟﻘﻮه ﯾﮏ ﺑﯿﺎن ﻣﻨﻄﻘﯽ اﺳﺖ (ﺳﯿﻒ، 1380).
ﻣﺪلﻫﺎی ﻧﻈﺮﯾﻪ ﺳﺆال ـ ﭘﺎﺳﺦ را ﻣﯽﺗﻮان ﺑﻪ دو ﻧـﻮع ﭘﺎراﻣﺘﺮﯾـﮏ و ﻧﺎﭘﺎراﻣﺘﺮﯾـﮏ ﺗﻘـﺴﯿﻢ ﮐـﺮد.
ﻣﺪلﻫﺎی ﻧﺎﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، اﺟﺎزه ﻣﯽدﻫﺪ ﮐﻪ ﭘﺎراﻣﺘﺮﻫﺎی ﻫﺮ ﺳﺆال، ﻣﺜﻞ ﺿﺮﯾﺐ دﺷﻮاری و
ﺿﺮﯾﺐ ﺗﻤﯿﺰ ﺳﺆال را ﺑﺎ رﺗﺒﻪﺑﻨﺪی ﭘﺎﺳﺦدﻫﻨﺪﮔﺎن ﺑﺮ اﺳﺎس ﻧﻤﺮه آنﻫـﺎ (ﺗﻌـﺪاد ﭘﺎﺳـﺦﻫـﺎی درﺳـﺖ
ﺑﻪﻋﻼوه ﺧﻄﺎی ﺗﺼﺎدﻓﯽ) ﮐﻪ روی θ ﻣﺮﺗﺐ ﺷﺪهاﺳﺖ، ﺑﺮآورد ﮐﻨﯿﻢ.
ﻣﻮﻓﻘﯿﺖ در ﮐﺎرﺑﺮد ﻣﺪلﻫـﺎی ﻏﯿﺮﭘﺎراﻣﺘﺮﯾـﮏ ﺳـﺆال- ﭘﺎﺳـﺦ (IRT) ﺑـﺮ ﻓـﺮض ﻫـﺎی ﻣﻌﯿﻨـﯽ
اﺳﺘﻮاراﺳﺖ ﮐﻪ ﺑﻪ ﻣﺎﻫﯿﺖ ﭘﺎﺳﺦ ﺳﺆاﻻت ﺑﺮ ﻣﯽ ﮔﺮدد. ﺑﻪﻋﺒﺎرت دﯾﮕﺮ، ﻣـﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾـﮏ ﺳـﺆال-
ﭘﺎﺳﺦ ﺑﺮ ﭘﺎﯾﻪ ﻓﺮضﻫﺎﯾﯽ ﺑﻨﺎ ﺷﺪه اﺳﺖ.اﯾﻦ ﻣﺪل ﻣﺒﺘﻨﯽ ﺑﺮ ﺳﻪ ﻓﺮض اﺳﺎﺳﯽ اﺳﺖ ؛اوﻟـﯿﻦ ﻓـﺮض ﺑـﺎ
ﺳﺎﺧﺘﺎر اﺑﻌﺎد دادهﻫﺎی آزﻣﻮن؛ دوﻣﯽ ﺑﺎ ﺷﮑﻞ رﯾﺎﺿﯽ ﺗﺎﺑﻊ وﯾﮋﮔﯽ ﺳﺆال ﯾﺎ ﻣﻨﺤﻨﯽ وﯾﮋه ﺳﺆال، ﮐﻪ ﺑـﺎ
ICC ﻧﺸﺎن داده ﻣﯽﺷﻮد (ﻫﻤﺒﺘﻠﻮن و ﺟﻮﻧﺰ، 1993) و ﺳﻮﻣﯽ ﺑﺎ ﯾﮑﻨﻮاﺧﺘﯽ ﺗﻮاﺑﻊ ﺳﺆال – ﭘﺎﺳـﺦﻫـﺎ
ارﺗﺒﺎط دارد.
اﻟﻒ – ﺗﮏﺑﻌﺪی ﺑﻮدن
اوﻟﯿﻦ ﻓﺮض، ﺗﮏﺑﻌﺪی ﺑﻮدن اﺳﺖ. ﯾﻌﻨﯽ، ﻫﻤﻪ ﺳﺆاﻻت آزﻣﻮن ﯾﮏ ﺻﻔﺖ ﻣﮑﻨﻮن ﻣﺸﺎﺑﻪ را
اﻧﺪازه ﻣﯽﮔﯿﺮﻧﺪ (ﺳﯿﺠﺖﺳﻤﺎ و ﻣﻮﻟﻨﺎر2002). ﺑﻪ ﺗﻌﺒﯿﺮ دﯾﮕﺮ، ﺗﮏﺑﻌﺪی ﺑﻮدن آزﻣﻮن ـ ﯾﻌﻨﯽ اﺣﺘﻤﺎل
ﻋﻤﻠﮑﺮد ﻣﻮﻓﻘﯿﺖآﻣﯿﺰ آزﻣﻮدﻧﯽ در ﻣﺠﻤﻮﻋﻪای از ﺳﺆاﻻت ـ را ﻣﯽﺗﻮان ﺑﻪﺻﻮرت ﯾﮏ ﻣﺪل رﯾﺎﺿﯽ
ﮐﻪ ﻓﻘﻂ ﯾﮏ ﭘﺎراﻣﺘﺮ ﺗﻮاﻧﺎﯾﯽ دارد، اراﺋﻪ ﮐﺮد (دراﻧﺰ و ﮐﯿﻨﮕﺴﺘﻦ
3
، 1985 ). اﻟﺒﺘﻪ ﻫﻤﺒﻠﺘﻮن (1989)
1. Hambleton & Jones 2. ability 3. Dorans & Kingston
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
44
ﻣﯽﮔﻮﯾﺪ ﮐﻪ ﻓﺮض ﺗﮏﺑﻌﺪی ﺑﻪﺻﻮرت ﮐﺎﻣﻞ ﺻﺎدق ﻧﺨﻮاﻫﺪ ﺑﻮد، زﯾﺮا ﻫﻤﯿﺸﻪ ﯾﮏﺳﺮی ﻋﻮاﻣﻞ
ﺷﻨﺎﺧﺘﯽ، ﺷﺨﺼﯿﺘﯽ، اﺟﺮاﯾﯽ و ... وﺟﻮد دارد ﮐﻪ – ﺣﺪاﻗﻞ ﺗﺎ اﻧﺪازهای – ﻋﻤﻠﮑﺮد در آزﻣﻮن را
ﺗﺤﺖﺗﺄﺛﯿﺮ ﻗﺮار ﻣﯽدﻫﺪ. ﻫﻤﺒﻠﺘﻮن وﮐﻮک (1977) ﺑﻪﻧﻘﻞ از ﻟﺮد در 1968 ﻣﯽﻧﻮﯾﺴﻨﺪ ﮐﻪ ﻓﺮض
ﺗﮏﺑﻌﺪی ﺑﻮدن در ﻣﻮرد ﻣﺠﻤﻮﻋﻪ ﺳﺆاﻻت آزﻣﻮنﻫﺎی ﭼﻨﺪﮔﺰﯾﻨﻪای، ﺑﻪﻃﻮر ﮐﺎﻣﻞ ﺑﺮای ﺑﺴﯿﺎری از
آزﻣﻮنﻫﺎ ﻣﺼﺪاق ﻧﺪارد؛ ﻫﺮ ﭼﻨﺪ ﻟﺮد اﺿﺎﻓﻪ ﻣﯽﮐﻨﺪ ﮐﻪ در ﺑﻌﻀﯽ ﻣﻮارد ﺑﺎ ﺗﻘﺮﯾﺐ ﺧﻮﺑﯽ ﻗﺎﺑﻞ ﻗﺒﻮل
اﺳﺖ.
ب- اﺳﺘﻘﻼل ﻣﻮﺿﻌﯽ
ﻓﺮض اﺳﺘﻘﻼل ﻣﻮﺿﻌﯽ ﺑﻪ اﯾﻦ ﻣﻌﻨﯽ اﺳﺖ ﮐﻪ ﭘﺎﺳﺦ ﻓﺮد ﺑﻪ ﯾﮏ ﺳﺆال، ﺗﺤﺖﺗﺄﺛﯿﺮ ﭘﺎﺳﺦﻫﺎی او
ﺑﻪ ﺳﺆاﻻت دﯾﮕﺮ آزﻣﻮن ﻧﯿﺴﺖ. ﺑﺮای ﻣﺜﺎل، اﺳﺘﻘﻼل ﻣﻮﺿﻌﯽ ﻣﻤﮑﻦ اﺳﺖ ﺑﺎ ﯾﺎدﮔﯿﺮی ای ﮐﻪ ﺑـﺮ اﺛـﺮ
ﺗﻤﺮﯾﻦ ﺑﻪوﺟﻮد آﻣﺪه ﻧﻘﺾ ﺷﻮد (ذواﻟﻔﻘﺎر ﻧﺴﺐ،1385). اﯾﻦ اﻣﺮ در ﻃﻮل اﺟﺮای آزﻣﻮن، ﻫﻨﮕﺎﻣﯽ ﮐﻪ
ﻧﻤﺮهﮔﺬاری روی ﺻﻔﺖ ﻣﮑﻨﻮن ﺻﻮرت ﻣﯽﮔﯿﺮد، رخ ﻣﯽدﻫﺪ. در ﺻﻮرﺗﯽﮐﻪ اﺣﺘﻤﺎل ﭘﺎﺳﺦ ﺑﻪ ﺳـﺆال
ﻣﻌﯿﻨﯽ ﺑﺮای آزﻣﻮدﻧﯽ 0/2 ،A و ﺑﺮای آزﻣﻮدﻧﯽ 0/9 ،B ﺑﺎﺷـﺪ و ﭼﻨﺎﻧﭽـﻪ ﭘﺎﺳـﺦﻫـﺎی آزﻣـﻮدﻧﯽﻫـﺎ
ﺑﻪﺻﻮرت ﻣﻮﺿﻌﯽ ﻣﺴﺘﻘﻞ از ﯾﮑﺪﯾﮕﺮ ﺑﺎﺷﺪ، اﺣﺘﻤﺎل اﯾﻦﮐـﻪ ﻫـﺮ دوی آﻧﻬـﺎ ﭘﺎﺳـﺦ درﺳـﺖ ﺑﺪﻫﻨـﺪ،
ﻣﺴﺎوی ﺑﺎ 0/2)(0/9) =0/18) اﺳﺖ (آﻟﻦ و ﯾﻦ، 1979 / ﺗﺮﺟﻤﻪ ﻋﻠﯽ دﻻور، 1374).
ج- ﯾﮑﻨﻮاﺧﺘﯽ ﺗﻮاﺑﻊ ﺳﺆال ﭘﺎﺳﺦﻫﺎ
ﻓﺮض ﺑﻌﺪی اﯾﻦ اﺳﺖ ﮐﻪ اﺣﺘﻤﺎل ﺷﺮﻃﯽ ( θ)
p ﺑﻪﻃـﻮر ﯾﮑﻨﻮاﺧـﺖ روی θ ﺑـﺪون ﮐـﺎﻫﺶ i
اﺳﺖ. اﯾﻦ ﻓﺮض در ﻣﻌﺎدﻟﻪ1 ﻧﺸﺎن داده ﺷﺪه اﺳﺖ. ﺑﻪروﺷﻨﯽ ﻣﯽﺗﻮان دﯾـﺪ وﻗﺘـﯽ ﻫـﻢ ﮐـﻪ اﺣﺘﻤـﺎل
= 0 Xi
اﺳﺖ، ﺑﺎ ﺗﺎﺑﻊ ﺳﺆال ـ ﭘﺎﺳﺦ ﻗﺎﺑﻞ ﺗﻮﺻﯿﻒ اﺳﺖ.
( = 0θ ) =1 − ( =1θ ) (1) ﻣﻌﺎدﻟﻪ
i
Xi
p X p
ﻣﺪلﻫﺎی ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، دو ﻧﻮع اﺳﺖ: (اﻟﻒ) ﻣﺪل ﻫﻤﮕﻨﯽ ﯾﮑﻨـﻮاﺧﺘﯽ
1
و (ب)
ﻣﺪل ﻫﻤﮕﻨﯽ ﯾﮑﻨﻮاﺧﺘﯽ ﺟﻔﺘﯽ
2
. ﻣﺪل ﻫﻤﮕﻨﯽ ﯾﮑﻨﻮاﺧﺘﯽ ﺑﺮ ﻣﺒﻨﺎی ﻓﺮض ﺗﮏﺑﻌـﺪی ﺑـﻮدن، اﺳـﺘﻘﻼل
ﻣﻮﺿﻌﯽ و ﯾﮑﻨﻮاﺧﺘﯽ ﻗﺮار ﮔﺮﻓﺘﻪ اﺳﺖ. اﯾﻦ ﻣﺪل ﺑﻪﺻﻮرت ﻫﻤﮕﻮن اﯾﺠﺎد ﺷﺪهاﺳﺖ. ﺗﻮاﺑـﻊ ﺳـﺆال ـ
ﭘﺎﺳﺦ آن ﺑﻪﺻﻮرت ﯾﮑﻨﻮاﺧـﺖ ﺑـﻪ ﺻـﻔﺖ ﻣﮑﻨـﻮن ارﺗﺒـﺎط دارد. اﻫﻤﯿـﺖ ﮐـﺎرﺑﺮدی ﻣـﺪل ﻫﻤﮕﻨـﯽ
ﯾﮑﻨﻮاﺧﺘﯽ اﯾﻦ اﺳﺖ ﮐﻪ ﻣﯽﺗﻮان ﭘﺎﺳﺦدﻫﻨـﺪﮔﺎن را ﺑـﺎ ﻧﻤـﺮهﮐـﻞ، روی ﻣﻘﯿـﺎس θ رﺗﺒـﻪﺑﻨـﺪی ﮐـﺮد.
ﺑﻨﺎﺑﺮاﯾﻦ، ﻣﺪﻟﯽ اﺳﺖ ﮐﻪ در آن، اﻓﺮاد ﺑﺮاﺳﺎس ﯾﮏ ﻣﻘﯿﺎس ﺗﺮﺗﯿﺒﯽ ﻣﻮرد اﻧﺪازهﮔﯿﺮی ﻗﺮار ﻣـﯽﮔﯿﺮﻧـﺪ.
اﮔﺮ c را ﻣﻘﺪاری ﺛﺎﺑﺖ درﻧﻈﺮ ﺑﮕﯿﺮﯾﻢ و اﯾﻦ ﻣﻘﺪار ﺛﺎﺑﺖ را ﺑﺎ s و t ﺟﻤﻊ ﮐﻨـﯿﻢ، ﺑـﻪ ﺷـﺮط ﺑﺮﻗـﺮاری
:داﺷﺖ ﺧﻮاﻫﯿﻢ o ≤ s ≤ t ≤ k راﺑﻄﻪ
1. monotone homogeneity model
2. double homogeneity model
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 45
p( > c X = s) ≤ p( > c X = t) (2) ﻣﻌﺎدﻟﻪ θ +
θ +
ﻣﻌﺎدﻟﻪ (2) ﺑﻪ اﯾﻦ ﻣﻌﻨﯽ اﺳﺖ ﮐﻪ اﻓﺮاد را ﻣﯽﺗﻮان ﺑﺎ
+
X ﺑﻪﺻﻮرت اﺣﺘﻤـﺎﻟﯽ روی θ رﺗﺒـﻪﺑﻨـﺪی
ﮐﺮد.
دوﻣﯿﻦ ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆالـ ﭘﺎﺳﺦ ﺑﺮای ﺳـﺆاﻻت دوارزﺷـﯽ، ﻣـﺪل ﻫﻤﮕﻨـﯽ ﯾﮑﻨـﻮاﺧﺘﯽ
ﺟﻔﺘﯽ (DMM) اﺳﺖ. اﯾﻦ ﻣﺪل در ﺳﻪ ﻓﺮض ﺑﺎ اوﻟﯿﻦ ﻣﺪل ﻣﺸﺘﺮک اﺳﺖ. ﺑـﺮای ﻓﻬـﻢ ﺑﻬﺘـﺮ اﯾـﻦ
ﻣﻄﻠﺐ، اول ﺑﻪ ﺳﺆالﻫﺎی دوارزﺷﯽ ﻣﯽﭘﺮدازﯾﻢ ﮐﻪ ﺑﻪﺻﻮرت ο و 1 ﻧﻤـﺮهﮔـﺬاری ﻣـﯽﺷـﻮﻧﺪ. ﻧﻤـﺮه
ﺷﺮﻃﯽ ﻣﻮرداﻧﺘﻈﺎر ﻫﺮ ﺳﺆال ﺑﺮاﺑﺮ اﺳﺖ ﺑﺎ ﻣﻘﺎدﯾﺮ ﺗﺎﺑﻊ ﺳﺆال ـ ﭘﺎﺳﺦ آن. ﯾﻌﻨﯽ:
ﻣﻌﺎدﻟﻪ (3)
( θ ) 0 ( 0θ ) 1 ( 1θ ) (θ ) E X i
= × P X i
= + × P X i
= = Pi
ﺑﻪﻋﺒﺎرت دﯾﮕﺮ، ﺗﻐﯿﯿﺮﻧﺎﭘﺬﯾﺮی ﺗﺮﺗﯿﺐ ﺑﺮ اﯾﻦ دﻻﻟﺖ دارد ﮐـﻪ اﺣﺘﻤـﺎل ﭘﺎﺳـﺨﮕﻮﯾﯽ ﺑـﻪ ﺳـﺆال i
P j ﮐﻮﭼﮏﺗﺮ ﻣﺴﺎوی ﺳﺆال j اﺳﺖ:
≤Pi
ﺑﺮای ﺗﺤﻠﯿﻞ دادهﻫﺎ در ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال– ﭘﺎﺳﺦ، دو ﺑﺮرﺳﯽ ﺻﻮرت ﻣﯽﮔﯿﺮد.
Pi اﻟﻒ – ﺑﺮرﺳﯽ ﭘﺬﯾﺮش ﺳﺆال (
(
در ﻧﻈﺮﯾﻪ ﺳﺆال ـ ﭘﺎﺳﺦ، ً ﻋﻤﻮﻣﺎ و ﻣـﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾـﮏ آن ً ﺧـﺼﻮﺻﺎ، وﯾﮋﮔـﯽﻫـﺎی ﺳـﺆاﻻت،
ﻣﺴﺘﻘﻞ از وﯾﮋﮔﯽﻫﺎی آزﻣﻮدﻧﯽﻫﺎی ﻧﻤﻮﻧﻪ ﻣﻌﯿﻦ و درواﻗﻊ ﺑـﺮ اﺳـﺎس ﺟﺎﻣﻌـﻪ آزﻣـﻮدﻧﯽﻫـﺎ ﺑـﺮآورد
ﻣﯽﺷﻮد (ﺳﯿﺠﺖﺳﻤﺎ و ﻣﻮﻟﻨﺎر2002). اﯾﻦ ﭘﺎراﻣﺘﺮ ﻧﺸﺎن ﻣﯽدﻫﺪ ﮐﻪ ﻣﻨﺤﻨﯽ وﯾﮋﮔﯽ ﺳـﺆال در ﮐﺠـﺎی
ﻣﻘﯿﺎس ﺗﻮاﻧﺎﯾﯽ ﻗﺮار دارد و ﻣﻌﺎدل دﺷﻮاری ﺳﺆال در ﻧﻈﺮﯾﻪ ﺳﺆال ـ ﭘﺎﺳـﺦ در راﺑﻄـﻪ ﺑـﺎ
ﺳﻄﺢ ﺻﻔﺖ زﯾﺮﺑﻨﺎﯾﯽ θ اﺳﺖ (ﻣﻮﻟﻨﺎر، 1997).
ب- ﺑﺮرﺳﯽ ﻣﻘﯿﺎسﭘﺬﯾﺮی ﺗﮏﺗﮏ ﺳﺆالﻫﺎ
ﺷﻮد، ﺳـﺆال را در ﺗﻤﺎﯾﺰﮔـﺬاری ﯾـﺎ ﺗـﺸﺨﯿﺺ i ﻧﺸﺎن داده ﻣﯽ ﻗـﺪرت اﯾﻦ ﭘﺎراﻣﺘﺮ ﮐﻪ ﺑﺎ ﻧﻤﺎد H
آزﻣﻮدﻧﯽﻫﺎ در ﺳﻄﻮح ﻣﺨﺘﻠﻒ ﺗﻮاﻧﺎﯾﯽ ﻧﺸﺎن ﻣﯽدﻫﺪ و ﺗﻌﯿﯿﻦ ﻣﯽﮐﻨﺪ ﮐﻪ ﻫﺮ ﺳﺆال آزﻣﻮن ﺗﺎ ﭼﻪ ﺣـﺪ
ﻣﯽ ﺗﻮاﻧﺪ آزﻣﻮدﻧﯽﻫﺎ را در ﺳﻄﻮح ﻣﺨﺘﻠﻒ ﺗﻮاﻧﺎﯾﯽ ﺗﻔﮑﯿﮏ ﮐﻨﺪ. در واﻗﻊ، اﯾـﻦ ﭘـﺎراﻣﺘﺮ ﻧـﺸﺎندﻫﻨـﺪه
ﻫﻤﺴﻮﯾﯽ و ﻫﻤﺎﻫﻨﮕﯽ ﺳﺆال ﺑﺎ ﮐﻞ آزﻣﻮن اﺳﺖ و ﯾﺎ ﺑﯿﺎﻧﮕﺮ آن اﺳﺖ ﮐـﻪ آﯾـﺎ ﺳـﺆال ﻫﻤـﺎن وﯾﮋﮔـﯽ
ﻣﻮردﻧﻈﺮ آزﻣﻮن را اﻧﺪازهﮔﯿﺮی ﻣﯽﮐﻨﺪ ﯾﺎ ﻧﻪ؟ ﻫﺮ ﭼﻪ ﻗﺪر ﻗﺪرت ﺗـﺸﺨﯿﺺ ﺳـﺆال ﺑـﯿﺶ ﺗـﺮ ﺑﺎﺷـﺪ،
ﻧﺸﺎندﻫﻨﺪه اﯾﻦ اﺳﺖ ﮐﻪ آزﻣﻮدﻧﯽﻫﺎﯾﯽ ﺑﺎ ﺗﻮاﻧﺎﯾﯽ ﭘﺎﯾﯿﻦ، ﮐﻪ در ﮐﻞ آزﻣﻮن ﻋﻤﻠﮑﺮد ﭘﺎﯾﯿﻨﯽ داﺷـﺘﻪاﻧـﺪ،
ﺑﻪ اﺣﺘﻤﺎل زﯾﺎد ﺑﻪ ﺳﺆال ﻣﻮردﻧﻈﺮ ﻏﻠﻂ ﭘﺎﺳﺦ ﻣﯽ دﻫﻨﺪ و آزﻣﻮدﻧﯽﻫﺎﯾﯽ ﺑﺎ ﺳﻄﻮح ﺑﺎﻻی ﺗﻮاﻧﺎﯾﯽ، ﮐـﻪ
در ﮐﻞ آزﻣﻮن ﻋﻤﻠﮑﺮد ﺑﺎﻻﯾﯽ داﺷﺘﻪاﻧﺪ، ﺑﻪ اﺣﺘﻤﺎل زﯾﺎد ﺳﺆال ﻣﺰﺑـﻮر را ﺑـﻪﺻـﻮرت ﺻـﺤﯿﺢ ﭘﺎﺳـﺦ
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
46
ﻣﯽدﻫﻨﺪ. ﻟﺮد (1980) ﺑﯿﺎن ﻣﯽﮐﻨﺪ ﮐﻪ ﻣﯿﺰان اﯾﻦ ﭘﺎراﻣﺘﺮ ﻧﺸﺎن ﻣﯽدﻫﺪ ﮐﻪ ﻫـﺮ ﭼـﻪ ﺑـﻪ ﺳـﻤﺖ ﺑـﺎﻻی
ﺧﺼﯿﺼﻪ ﻣﮑﻨﻮن ﻣﻮرد ﺳﻨﺠﺶ ﺑﺮوﯾﻢ، اﺣﺘﻤﺎل ﭘﺎﺳﺦ ﺻﺤﯿﺢ ﺑﻪ ﺳﺆال اﻓﺰاﯾﺶ ﻣﯽﯾﺎﺑﺪ. ﭼﻨﺎﻧﭽـﻪ ﻧﻤـﺮه
i ﻧـﺸﺎن دﻫـﯿﻢ ﭘﺎﺳـﺦ دو ﻓﺮد (a) در ﯾﮏ آزﻣﻮن ﻣﻌﯿﻦ را ﺑﺎ X و ﭘﺎﺳﺦ وی ﺑﻪ ﻫـﺮ ﺳـﺆال را ﺑـﺎ u
،
ارزﺷـــﯽ و ﺷـــﺎﻣﻞ ﺻـــﻔﺮ و ﯾـــﮏ اﺳـــﺖ و ﻧﻤـــﺮه ﻫـــﺮ ﻓـــﺮد در ﯾـــﮏ آزﻣـــﻮن n ﺳـــﺆاﻟﯽ:
( ) ( ) ∑
=
= =
n
i
Ta
Xa
uia
1
ε ε . در ﺻﻮرﺗﯽﮐﻪ ﻓﺮد در ﺳﻄﺢ ﺗﻮاﻧﺎﯾﯽ ﻣﺸﺨﺺ ﺑﺎﺷـﺪ، ﻋﺒـﺎرت ﻓـﻮق
ﺑﻪﺻﻮرت ﯾﮏ ﻋﺒﺎرت ﺷﺮﻃﯽ روی θ ﺗﻌﺮﯾﻒ ﻣﯽﺷﻮد:
ε ( )
IA
θ
N
I
TA ∑ U
=
=
1
از ﻃﺮف دﯾﮕﺮ، ﻃﺒﻖ آزﻣﺎﯾﺶ ﺑﺮﻧﻮﻟﯽ
1
ﺑﺮای ﻣﺘﻐﯿﺮﻫﺎی دوﺟﻤﻠﻪای، اﺣﺘﻤﺎل ﺷـﺮﻃﯽ وﻗـﻮع ﯾـﮏ
ﺣﺎدﺛﻪ ﺑﻪﺻﻮرت زﯾﺮ اﺳﺖ:
( ) ( ) ( )
( )
( ) θ
θ
ε θ θ θ
IA
IA IA
IA IA IA IA IA
P
P U
U P U P U
=
= =
= = + =
1
1. 1 0. 0
(ﻟﺮد و ﻧﺎوﯾﮏ، 1968 ).
اﺣﺘﻤﺎل ﺑﺮوز ﯾﮏ ﭘﯿﺸﺎﻣﺪ ﻧﺎﺳﺎزﮔﺎر ﻋﺒﺎرت اﺳﺖ از ﻣﺠﻤـﻮع اﺣﺘﻤـﺎلﻫـﺎی ﻫـﺮ دو آن ﻫـﺎ ﮐـﻪ
ﻣﺴﺎوی ﯾﮏ ﺧﻮاﻫﺪ ﺑﻮد. از ﻃﺮﻓﯽ، در ﺗﻮزﯾﻊ دو ﺟﻤﻠـﻪای ﮐـﻪ در آن ﺑـﺎ ﻣﺘﻐﯿـﺮ دوارزﺷـﯽ ﮔﺴـﺴﺘﻪ
ﺳﺮوﮐﺎر دارﯾﻢ، در ﺻﻮرت ﺑﺮوز ﯾﮏ ﭘﯿﺸﺎﻣﺪ، ﭘﯿﺸﺎﻣﺪ دﯾﮕﺮ ﻏﯿﺮﻣﻤﮑﻦ ﺧﻮاﻫﺪ ﺑﻮد. ﺑﻨﺎﺑﺮاﯾﻦ، در واﻗـﻊ
آﻧﭽﻪ ﺑﺎﻗﯽ ﻣﯽﻣﺎﻧﺪ، اﺣﺘﻤﺎل ﭘﯿﺸﺎﻣﺪ ﻣﻮردﻧﻈﺮ اﺳﺖ. در اﯾﻦ ﺟﺎ ﻣﻨﻈﻮر، اﺣﺘﻤﺎل ﭘﺎﺳﺦ درﺳﺖ ﻓﺮد a ﺑﺎ
ﺳﻄﺢ ﺗﻮاﻧﺎﯾﯽ θ ﺑﻪ ﺳﺆال i ( ﯾﻌﻨﯽ( Pia (θ ) اﺳﺖ. ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻣﻄﺎﻟﺐ ﺑﯿﺎن ﺷﺪه، ﭘﺲ:
T = P ( ) θ
N
I =
A
∑ IA
1
ﯾﻌﻨﯽ، ﻧﻤﺮه ﺣﻘﯿﻘﯽ آزﻣﻮدﻧﯽ a در ﯾﮏ آزﻣﻮن n ﺳﺆاﻟﯽ، ﺑﺮاﺑﺮ ﺑﺎ ﻣﺠﻤﻮع اﺣﺘﻤـﺎلﻫـﺎی ﺷـﺮﻃﯽ
ﭘﺎﺳﺦﻫﺎی او ﺑﻪ ﺳﺆاﻻت آزﻣﻮن ﻣﺬﮐﻮر ﺧﻮاﻫﺪ ﺑـﻮد. در ﺻـﻮرﺗﯽ ﮐـﻪ اﺣﺘﻤـﺎل ﺷـﺮﻃﯽ ﺑـﺮای ﻫﻤـﻪ
ﺳﺆاﻻت و آزﻣﻮدﻧﯽﻫﺎ ﻣﺤﺎﺳﺒﻪ و ﺟﻤﻊ ﺷﻮد، ﻧﻤﺮه ﺣﻘﯿﻘﯽ آزﻣﻮن ﺑﻪدﺳﺖ ﻣﯽآﯾﺪ؛ در ﻣﻌﺎدﻟﻪ ﺑﺎﻻ، ﺗﺄﺛﯿﺮ
ﺗﻌﺪاد ﺳﺆاﻻت آزﻣﻮن ﺑﺮ ﻧﻤﺮه ﺣﻘﯿﻘﯽ آزﻣﻮن و آزﻣﻮدﻧﯽ ﺑﻪوﺿﻮح ﻣﺸﺎﻫﺪه ﻣﯽﺷﻮد. ﻫـﺮ ﻗـﺪر ﺗﻌـﺪاد
ﺳﺆاﻻت آزﻣﻮن ﺑﯿﺸﺘﺮ ﺷﻮد، ﺗﻌﺪاد ( pia(θ ﻫﺎ اﻓﺰاﯾﺶ ﻣﯽﯾﺎﺑﺪ و ﺑﻪﺗﺒـﻊ آن T ﻫـﻢ اﻓـﺰاﯾﺶ ﺧﻮاﻫـﺪ
1 - Bernoly
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 47
داﺷﺖ. از ﻃﺮف دﯾﮕﺮ، اﺣﺘﻤﺎل ﭘﺎﺳﺨﮕﻮﯾﯽ ﺻﺤﯿﺢ ﺑﻪ ﺳﺆاﻻت دﺷﻮار ﮐﻢ ﺗﺮ از ﺳﺆاﻻت ﺳﺎده اﺳـﺖ؛
ﺑﻨﺎﺑﺮﯾﻦ در ﺻﻮرت ﻧﺎﻣﺴﺎوی ﺑﻮدن درﺟﻪ دﺷﻮاری ﺳﺆاﻻت دو آزﻣﻮن ﻧﺎﻣﻮازی، ﺑﺮآورد ﻧﻤﺮه ﺣﻘﯿﻘـﯽ
ﯾﮏ آزﻣﻮدﻧﯽ در آن آزﻣﻮن ﻣﺘﻔﺎوت ﺧﻮاﻫﺪ ﺑﻮد و ﺑﻪﻋﺒﺎرت دﯾﮕﺮ، ﺑـﺮآورد ﻧﻤـﺮه ﺣﻘﯿﻘـﯽ آزﻣـﻮدﻧﯽ،
ﺻﺮفﻧﻈﺮ از ﻋﻮاﻣﻞ دﯾﮕﺮ، واﺑﺴﺘﻪ ﺑﻪ آزﻣﻮن، ﻧﻮﺳﺎﻧﺎت ﻧﻤﻮﻧﻪﺑـﺮداری و ﺗﻌـﺪاد ﺳـﺆاﻻت ﻣﻮﺟـﻮد در
آزﻣﻮن ﺧﻮاﻫﺪ ﺑﻮد (از ﻣﻌﺎﯾﺐ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی ﮐﻪ ﻗﺒﻼ ﺑﻪ آن اﺷﺎره ﺷﺪ). اﻟﺒﺘﻪ ﻫﻤـﺎنﻃـﻮر
ﮐﻪ ﻟﺮد و ﻧﺎوﯾﮏ (1968) ﻓﺮﻣﻮﻟﯽ را اراﺋﻪ ﻧﻤﻮدهاﻧﺪ، ﺑﺎ در دﺳﺖ داﺷﺘﻦ ﺷﺎﺧﺺﻫﺎی ﮐﻼﺳﯿﮏ ﺳـﺆال
و ﻓﺮد ﻣﯽﺗﻮان ﻧﻤﺮه واﻗﻌﯽ را ﺑﻪﻃﻮر ﺗﻘﺮﯾﺒﯽ ﺑﻪدﺳﺖ آورد.
R ( ) T a
X a
= r
xx
X a
+ (1 − r
xx
)X
ﺑﺮآورد رﮔﺮﺳﯿﻮن ﻧﻤﺮه ﺣﻘﯿﻘﯽ آزﻣﻮدﻧﯽ a از روی ﻧﻤـﺮه ﻣـﺸﺎﻫﺪه ﺷـﺪه وی، ﻧﯿﺎزﻣﻨـﺪ داﺷـﺘﻦ
ﺑﺮآوردی از اﻋﺘﺒﺎر آزﻣﻮن، ﻧﻤﺮه ﻣﺸﺎﻫﺪه ﺷﺪه آزﻣﻮدﻧﯽ a و ﻣﯿﺎﻧﮕﯿﻦ آزﻣﻮن اﺳﺖ. ﻧﺘﯿﺠﻪ، ﺑﺮآوردی از
ﻧﻤﺮه ﺣﻘﯿﻘﯽ ﻓﺮد a از روی ﻧﻤﺮه ﻣﺸﺎﻫﺪه ﺷﺪه او ﺧﻮاﻫﺪ ﺑﻮد. ﻧﮑﺘﻪ دﯾﮕﺮ آنﮐـﻪ، اﮔـﺮ اﺣﺘﻤـﺎلﻫـﺎی
ﺷﺮﻃﯽ ﻣﻌﺎدﻟﻪ ﻓﻮق ﻣﻌﺪلﮔﯿﺮی ﺷﻮد و ﻣﯿﺎﻧﮕﯿﻦ ﭘﺎﺳﺦ ﺻﺤﯿﺢ در ﻫﺮ ﺳﻄﺢ ﺑﺮای ﺳـﺆالﻫـﺎ ﺑـﻪدﺳـﺖ
آﯾﺪ، از ﻃﺮﯾﻖ آن ﻣﯽﺗﻮان ﻣﻨﺤﻨﯽ وﯾﮋه آزﻣﻮن (TCC) را رﺳﻢ ﮐﺮد.
( )
( )
n
p
T P
i
∑ i
=
= =
1
θ
θ
اﺣﺘﻤﺎلﻫﺎی ﺷﺮﻃﯽ ﭘﺎﺳﺦ ﻫﻤﻪ آزﻣﻮدﻧﯽﻫﺎی ﺳﻄﺢ ﻣﻌﯿﻨﯽ از θ ﺑﻪ ﺳﺆاﻻت آزﻣﻮن، ﺟﻤﻊ ﺷﺪه،
ﺑﺮ ﺗﻌﺪاد ﺳﺆاﻻت ﺗﻘﺴﯿﻢ ﻣﯽﺷﻮد. ﻧﺘﯿﺠﻪ اﯾﻦ ﻣﺤﺎﺳﺒﻪ، ﻣﺘﻮﺳﻂ اﺣﺘﻤـﺎل ﭘﺎﺳـﺦ ﺻـﺤﯿﺢ ﺑـﻪ ﺳـﺆاﻻت
آزﻣﻮن در آن ﺳﻄﺢ ﺗﻮاﻧﺎﯾﯽ ﺧﻮاﻫﺪ ﺑﻮد. ﺑﺎ اداﻣﻪ ﻣﺤﺎﺳﺒﻪ ﻓﻮق ﺑﺮای θﻫﺎی ﻣﺨﺘﻠﻒ ﻣﯽﺗﻮان (TCC)
را رﺳﻢ ﮐﺮد ﮐﻪ در آن، ﻣﺤﻮر اﻓﻘﯽ ﺷﺎﻣﻞ ﺗﻮاﻧﺎﯾﯽ ﯾﺎ θ و ﻣﺤﻮر ﻋﻤﻮدی ﯾﺎ y ﺷﺎﻣﻞ ﻣﺘﻮﺳﻂ اﺣﺘﻤﺎل
ﻣﺤﺎﺳﺒﻪ ﺷﺪه ﯾﺎ ( p(θ اﺳﺖ.
ﺑﺎ ﮔﺬﺷﺖ ﺑﯿﺶ از 60 ﺳﺎل از ﮐﺎر ﻧﻈﺮﯾﻪ ﺳﺆال ـ ﭘﺎﺳﺦ و ﮔﺴﺘﺮش ﭘﺮﺷﺘﺎب ﻣﺒﺎﻧﯽ ﻧﻈﺮی آن در
ﺗﻤﺎم ﺳﺎلﻫﺎی دﻫﻪ 1980 و اواﯾﻞ ﺳﺎلﻫﺎی دﻫﻪ 1990، ﻣﺘﺄﺳـﻔﺎﻧﻪ در ﮐـﺸﻮر ﻣـﺎ اﯾـﻦ ﻧﻈﺮﯾـﻪ ﻫﻨـﻮز
آنﭼﻨﺎن ﮐﻪ ﺑﺎﯾﺪ و ﺷﺎﯾﺪ ﺷﻨﺎﺧﺘﻪ ﺷﺪه ﻧﯿﺴﺖ و ﺗﻌﺪاد ﺗﺤﻘﯿﻘﺎت در اﯾﻦ زﻣﯿﻨـﻪ ﺑـﺴﯿﺎر اﻧـﺪک اﺳـﺖ و
ﻫﻨﻮز ﻧﻈﺮﯾﻪ ﺳﺆال ـ ﭘﺎﺳﺦ ﺑـﻪﻃـﻮر اﻋـﻢ و ﻣـﺪل ﻧﺎﭘﺎراﻣﺘﺮﯾـﮏ ﺳـﺆال ـ ﭘﺎﺳـﺦ ﺑـﻪﻃـﻮر اﺧـﺺ، در
اﻧﺪازهﮔﯿﺮی ﺗﻮاﻧﺎﯾﯽﻫﺎی داوﻃﻠﺒﺎن در ﭘﺎﺳﺨﮕﻮﯾﯽ ﺑﻪ ﺳﺆاﻻت آزﻣﻮنﻫﺎی ورود ﺑﻪ ﻣﺮاﮐﺰ آﻣﻮزش ﻋﺎﻟﯽ
و دﯾﮕﺮ آزﻣﻮنﻫﺎ راه ﻧﯿﺎﻓﺘﻪ اﺳﺖ؛ در ﺣﺎﻟﯽﮐﻪ اﻟﺰاﻣﺎت ﺟﺎﻣﻌﻪ ﻣﺎ، ﺑﻪوﯾﮋه در ﺳﺎلﻫﺎی اﺧﯿﺮ و ﺑﺎ ﺗﻮﺟـﻪ
ﺑﻪ ﺧﯿﻞ ﻋﻈﯿﻢ داوﻃﻠﺒﺎن داﻧﺸﮕﺎهﻫﺎ و ﻣﺮاﮐﺰ و ﻣﻮﺳﺴﺎت آﻣﻮزش ﻋﺎﻟﯽ اﯾﺠﺎب ﻣﯽﮐﻨﺪ ﮐﻪ اﻓﺮاد، ﻫﺮﭼﻪ
دﻗﯿﻖﺗﺮ و درﺳﺖﺗﺮ، ﺑﺮﻣﺒﻨـﺎی ﺗﻮاﻧـﺎﯾﯽﻫـﺎی ذﻫﻨـﯽ ﺧـﻮد از ﯾﮑـﺪﯾﮕﺮ ﻣﺘﻤـﺎﯾﺰ و ﺑـﺮای ﺗﺤـﺼﯿﻞ در
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
48
داﻧﺸﮕﺎهﻫﺎ و ﻣﺆﺳﺴﺎت آﻣﻮزش ﻋﺎﻟﯽ اﻧﺘﺨﺎب ﺷﻮﻧﺪ. ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻣﻄﺎﻟﺐ ﻓـﻮق، اﯾـﻦ ﭘﺮﺳـﺶ ﻣﻄـﺮح
اﺳﺖ ﮐﻪ: ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆالـ ﭘﺎﺳﺦ از ﻧﻈﺮ وﯾﮋﮔـﯽﻫـﺎی ﺳـﺆال،
ﭼﻪ ﺗﻔﺎوﺗﯽ ﺑﺎ ﯾﮑﺪﯾﮕﺮ دارﻧﺪ؟
ﺑﻪﻣﻨﻈﻮر ﭘﺎﺳﺨﮕﻮﯾﯽ ﺑﻪ ﭘﺮﺳﺶ ﯾﺎد ﺷﺪه، ﺑﺎ اﺳﺘﻔﺎده از دادهﻫﺎی ﺣﺎﺻﻞ از اﺟﺮای اﯾﻦ ﭘـﮋوﻫﺶ،
ﭘﺮﺳﺶﻫﺎی زﯾﺮ ﻣﻮردﻧﻈﺮ ﻗﺮار ﮔﺮﻓﺖ:
1ـ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی و ﻣﺪل ﻧﺎﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻋﻤﻠﮑﺮد اﻓﺮاد در
آزﻣﻮن رﯾﺎﺿﯽ، از ﻧﻈﺮ ﺑﺮآورد ﺷﺎﺧﺺ ﯾﺎ ﭘﺎراﻣﺘﺮ ﺳﻄﺢ دﺷﻮاری ﺳﺆاﻻت آزﻣﻮن، ﭼﻪ ﺗﻔﺎوﺗﯽ دارﻧﺪ؟
2ـ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی و ﻣﺪل ﻧﺎﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻋﻤﻠﮑﺮد اﻓﺮاد در
آزﻣﻮن رﯾﺎﺿﯽ، از ﻧﻈﺮ ﺑﺮآورد ﺷﺎﺧﺺ ﯾﺎ ﭘﺎراﻣﺘﺮ ﻗـﺪرت ﺗـﺸﺨﯿﺺ ﺳـﺆاﻻت آزﻣـﻮن، ﭼـﻪ ﺗﻔـﺎوﺗﯽ
دارﻧﺪ؟
روش
ﺟﺎﻣﻌﻪ
ﺑﻪﻣﻨﻈﻮر ﭘﺎﺳﺦ ﺑﻪ ﭘﺮﺳـﺶﻫـﺎی ﭘﮋوﻫـﺸﯽ ﻣـﻮردﻧﻈﺮ، ﺟﺎﻣﻌـﻪ ای از ﮐﻠﯿـﻪ داوﻃﻠﺒـﺎن ورود ﺑـﻪ
داﻧﺸﮕﺎهﻫﺎی ﮐﺸﻮر در رﺷﺘﻪ رﯾﺎﺿﯽ ـ ﻓﯿﺰﯾﮏ در ﺳﺎل 1384اﻧﺘﺨﺎب ﺷﺪ. ﺟﺪول 1، ﺗﻌﺪاد داوﻃﻠﺒـﺎن
ﺷﺮﮐﺖ ﮐﻨﻨﺪه در ﮐﻨﮑﻮر ﺳﺮاﺳﺮی 1384 را در رﺷﺘﻪ رﯾﺎﺿﯽـ ﻓﯿﺰﯾﮏ ﻧﺸﺎن ﻣﯽدﻫﺪ.
ﺟﺪول 1. ﺗﻌﺪاد داوﻃﻠﺒﺎن ﺷﺮﮐﺖﮐﻨﻨﺪه در ﮐﻨﮑﻮر ﺳﺮاﺳﺮی 1384
در رﺷﺘﻪ رﯾﺎﺿﯽ ـ ﻓﯿﺰﯾﮏ
رﺷﺘﻪ زن درﺻﺪ ﻣﺮد درﺻﺪ ﮐﻞ
302511 54/09 163643 45/91 138868 ﻓﯿﺰﯾﮏ -رﯾﺎﺿﯽ
ﻧﻤﻮﻧﻪﮔﯿﺮی ﺑﺮ اﺳﺎس دﺳﺘﺮﺳﯽ ﺑﻪ ﻓﻬﺮﺳﺖ ﺗﺼﺎدﻓﯽ داوﻃﻠﺒﺎن و ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﺑﺮﻧﺎﻣـﻪ ﮐـﺎﻣﭙﯿﻮﺗﺮی
ﻃﺮاﺣﯽ ﺷﺪه در ﺳﺎزﻣﺎن ﺳﻨﺠﺶ آﻣﻮزش ﮐﺸﻮر، ﺑﺎ اﺳﺘﻔﺎده از روش ﻧﻤﻮﻧﻪﮔﯿﺮی ﻣﻨﻈﻢ اﻧﺠﺎم ﺷﺪ. از
ﺑﯿﻦ ﮐﻠﯿﻪ داوﻃﻠﺒﺎن ﺷﺮﮐﺖﮐﻨﻨﺪه در ﮔﺮوه آزﻣﺎﯾﺸﯽ رﯾﺎﺿﯽ ـ ﻓﯿﺰﯾﮏ، ﯾﮏ ﮔﺮوه 3000 ﻧﻔﺮی ﺑـﻪﻃـﻮر
ﺗﺼﺎدﻓﯽ اﻧﺘﺨﺎب ﺷﺪ و ﭘﺲ از ﺣﺬف آزﻣﻮدﻧﯽﻫﺎﯾﯽ ﮐﻪ ﺑﻪدرﺳﺘﯽ ﺑـﻪ ﺳـﺆاﻻت ﭘﺎﺳـﺦ ﻧﮕﻔﺘـﻪ ﺑﻮدﻧـﺪ
(ﻣﻨﻈﻮر، اﻓﺮادی ﻫﺴﺘﻨﺪ ﮐﻪ ﭘﺎﯾﯿﻦﺗﺮ از
4
1 ﻧﻤﺮه ﮐﻞ ﯾﺎ ﺣﺪ ﺷﺎﻧﺲ را ﮐﺴﺐ ﮐﺮده ﺑﻮدﻧﺪ)، از ﺑﯿﻦ اﻓـﺮاد
ﺑﺎﻗﯽ ﻣﺎﻧﺪه ﭼﻨﺪ ﻧﻤﻮﻧﻪﮔﯿﺮی ﺻﻮرت ﮔﺮﻓﺖ.
ﺑﺮﻃﺒﻖ ﻧﻈﺮ ﻃﺮﻓﺪاران ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ، ﯾﮑﯽ از ﻣﺰاﯾﺎی اﯾﻦ ﻧﻈﺮﯾﻪ آن اﺳﺖ ﮐﻪ ﺣﺠـﻢ ﻧﻤﻮﻧـﻪ در
آن ﻧﺴﺒﺖ ﺑﻪ ﻧﻈﺮﯾﻪ ﻣﺪل ﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆالـ ﭘﺎﺳﺦ و ﻣﺪل ﻏﯿﺮ ﭘﺎراﻣﺘﺮﯾـﮏ ﺳـﺆال – ﭘﺎﺳـﺦ، ﮐـﻢ ﺗـﺮ
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 49
اﺳﺖ. ﻣﻄﺎﻟﻌﺎت اﻧﺪﮐﯽ وﺟﻮد دارد ﮐﻪ ﺗﺄﺛﯿﺮ ﺣﺠﻢ ﻧﻤﻮﻧﻪ را ﺑﺮ ﺑﺮآوردﻫﺎﯾﯽ ﮐﻪ ﺑﺮای ﭘﺎﯾـﺎﯾﯽ ﭘﺎراﻣﺘﺮﻫـﺎ
ﺻﻮرت ﻣﯽﮔﯿﺮد، ﺑﻪﻃﻮر ﻣﻨﻈﻢ ﺑﺮرﺳﯽ ﮐﺮده ﺑﺎﺷﺪ. ﺣﺪاﻗﻞ ﺣﺠﻢ ﻧﻤﻮﻧﻪ ﭘﯿﺸﻨﻬﺎدی ﺑﺮای ﺑـﻪﮐـﺎرﮔﯿﺮی
ﻣﻮﺛﺮ CTT در داﻣﻨﻪای از ﺣﺪود 300 ﺗﺎ 500 ﻣﺘﻐﯿﺮ اﺳﺖ. اﻟﺒﺘﻪ ﺗﺮﺟﯿﺢ داده ﻣﯽﺷﻮد ﮐﻪ ﺣﺠﻢ ﻧﻤﻮﻧﻪ
1000 ﺑﺎﺷﺪ (ﺗﺮوﺳﮑﻮﺳﮑﯽ، 1999 ﺑﻪﻧﻘﻞ از ﻧﺎﻧﺎﻟﯽ، 1967). ﻣﻄﺎﺑﻖ ﭘـﮋوﻫﺶﻫـﺎی ﻣﻮﺟـﻮد در زﻣﯿﻨـﻪ
آزﻣﻮنﺳﺎزی، ﮐﺎرﺑﺮد ﻣﻮﻓﻖ ﻣﺪلﻫﺎی ﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال – ﭘﺎﺳﺦ و ﻣﺪل ﻫﺎی ﻏﯿﺮ ﭘﺎراﻣﺘﺮﯾﮏ ﺳـﺆال –
ﭘﺎﺳﺦ ﻣﺴﺘﻠﺰم اﺳﺘﻔﺎده از ﺳﺆاﻻت و آزﻣﻮدﻧﯽﻫﺎﯾﯽ ﺑﺎ ﺣﺠﻢ ﺑﺰرگ اﺳﺖ ﺗـﺎ ﺑﺘـﻮان ﺑـﻪﻃـﻮر ﻫﻤﺰﻣـﺎن
ﺻﻔﺖ ﻣﮑﻨﻮن و ﭘﺎراﻣﺘﺮﻫﺎی ﺳﺆال را ﺑـﺮآورد ﮐـﺮد (ﻟـﺮد، 1968 و ﻫﻤﺒﻠﺘـﻮن و ﺳـﻮآﻣﯿﻨﺎﺗﺎن، 1985).
ﺑﻨﺎﺑﺮاﯾﻦ در ﭘﮋوﻫﺶ ﺣﺎﺿﺮ، ﺑﺮ اﺳﺎس ﺗﺤﻘﯿﻘﺎت اﻧﺠﺎم ﺷﺪه در ﻫﺮ دو ﻧﻈﺮﯾﻪ و ﺑﺎ ﺗﻮﺟﻪ ﺑﻪ ﻧـﺮماﻓـﺰار
ﮐﺎﻣﭙﯿﻮﺗﺮی ﺑﻪﮐﺎر رﻓﺘﻪ، از ﺑﯿﻦ داوﻃﻠﺒﺎن ﮔﺮوه آزﻣﺎﯾﺸﯽ رﯾﺎﺿﯽـ ﻓﯿﺰﯾﮏ و از ﺑـﯿﻦ ﮔـﺮوهﻫـﺎی ﻧﻤﻮﻧـﻪ
ﻣﺨﺘﻠﻒ، در ﻧﻬﺎﯾﺖ دو ﻧﻤﻮﻧﻪ 1000 ﻧﻔﺮی، ﮐﻪ در آنﻫﺎ ﺗﻔﺎوت ﺗﻮاﻧﺎﯾﯽ آزﻣـﻮدﻧﯽﻫـﺎ ﺑـﯿﺶ ﺗـﺮ ﺑـﻮد،
اﻧﺘﺨﺎب ﺷﺪ.
اﺑﺰار و روش اﺟﺮا و ﺗﺤﻠﯿﻞ دادهﻫﺎ
در آزﻣﻮن ورودی داﻧﺸﮕﺎهﻫﺎی اﯾﺮان از آزﻣﻮنﻫﺎی ﭘﯿﺸﺮﻓﺖ ﺗﺤﺼﯿﻠﯽ اﺳـﺘﻔﺎده ﻣـﯽﺷـﻮد. اﯾـﻦ
آزﻣﻮنﻫﺎ در ﺳﺎزﻣﺎن ﺳﻨﺠﺶ و ﺗﻮﺳﻂ اﺳﺘﺎدان و ﻃﺮاﺣﺎن زﺑﺪه و ﮐﺎرﮐـﺸﺘﻪ ﮐـﺸﻮر ﻃﺮاﺣـﯽ و ﺗﻬﯿـﻪ
ﻣﯽﺷﻮد. اﺑﺰار ﻣﻮرد اﺳﺘﻔﺎده ﺑﺮای ﺟﻤﻊآوری دادهﻫﺎی ﭘﮋوﻫﺶ، ﭘﺎﺳﺨﻨﺎﻣﻪﻫﺎی 55 ﺳـﺆاﻟﯽ داوﻃﻠﺒـﺎن
در آزﻣﻮن اﺧﺘﺼﺎﺻﯽ درس رﯾﺎﺿﯽ ﺑﻮد.
در ﻣﻮرد ﺗﻌﺪاد ﺳﺆاﻻت در ﻣﻘﺎﯾﺴﻪ ﻣﺪلﻫﺎ، ﺻﺎﺣﺐﻧﻈﺮان، ﺣـﺪاﻗﻞ ﺣﺠـﻢ ﻧﻤﻮﻧـﻪ ﺳـﺆال را 15
ذﮐﺮ ﮐﺮدهاﻧﺪ. ﻟﯿﮑﻦ ﻣﺎﻧﻨﺪ آزﻣﻮدﻧﯽﻫﺎ، ﺗﻌﺪاد ﺳﺆاﻻت ﺧﺮدهآزﻣﻮنﻫﺎ ﻧﯿـﺰ از ﺗﻌـﺪاد ﭘﺎراﻣﺘﺮﻫـﺎی ﻣـﺪل
ﺗﺄﺛﯿﺮ ﻣﯽﭘﺬﯾﺮد. (ﻫﻤﺒﻠﺘﻮن، 1989).
ﺑﺮای ﺗﺠﺰﯾﻪ و ﺗﺤﻠﯿﻞ دادهﻫﺎ از ﻧﺮماﻓﺰارﻫﺎی ﮐـﺎﻣﭙﯿﻮﺗﺮی SPSS وMSP اﺳـﺘﻔﺎده ﺷـﺪ. اﺑﺘـﺪا
ﺗﺤﻠﯿﻞﻫﺎ و ﻣﺸﺨﺼﻪﻫﺎی ﮐﻼﺳﯿﮏ ﺳﺆالﻫﺎ و آزﻣﻮنﻫﺎ از ﻃﺮﯾﻖ SPSS ﻣﺤﺎﺳﺒﻪ ﺷﺪ و ﺳﭙﺲ دادهﻫﺎ
ﺑﺎ ﻧﺮماﻓﺰار MSP ﺗﺤﻠﯿﻞ ﺷﺪ. روشﻫﺎ و ﺷﺎﺧﺺﻫﺎی ﻣﻮرد اﺳﺘﻔﺎده ﺑﺮای ﺗﺤﻠﯿﻞ ﺳـﺆاﻻت ﺑـﺮ ﭘﺎﯾـﻪ
ﻣﺪل ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی، ﺷﺎﻣﻞ ﻣﯿﺎﻧﮕﯿﻦ ﯾﺎ درﺟﻪ دﺷﻮاری ﺳـﺆاﻻت، وارﯾـﺎﻧﺲ ﺳـﺆاﻻت، ﺿـﺮﯾﺐ
ﻫﻤﺒﺴﺘﮕﯽ دو رﺷﺘﻪای (rbis) و ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ دو رﺷﺘﻪای ﻧﻘﻄﻪای (rpbis) ﺑﻮد. در اﯾﻦ ﻣﺪل ﻧﯿـﺰ
ﺑﺮای آزﻣﻮنﻫﺎ از ﭘﺎﯾﺎﯾﯽ ﺑﻪ روش ﺿﺮﯾﺐ آﻟﻔﺎ (ﮐﻮدرـ رﯾﭽﺎردﺳـﻮن 20)، ﺗﻮزﯾـﻊ ﻓﺮاواﻧـﯽ و ﻧﻤـﻮدار
ﻧﻤﺮات آزﻣﻮنﻫﺎ و ... اﺳﺘﻔﺎده ﺷﺪ.
ﺑﻪ ﻣﻨﻈﻮر ﺗﺤﻠﯿﻞ دادهﻫﺎ در ﻧﻈﺮﯾﻪ ﻣﺪل ﻏﯿﺮ ﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆالـ ﭘﺎﺳﺦ، از روشﻫﺎی آﻣﺎری ﻣﺎﻧﻨـﺪ
آزﻣﻮن t واﺑﺴﺘﻪ، ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ ﭘﯿﺮﺳﻮن و آزﻣﻮنﻫﺎی ﻣﻌﻨﯽداری آن ﻫـﺎ اﺳـﺘﻔﺎده ﺷـﺪ و ﺳـﭙﺲ
ﻣﻘﺎﯾﺴﻪﻫﺎی ﻣﻮردﻧﻈﺮ اﻧﺠﺎم ﮔﺮﻓﺖ.
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
50
ﻧﺘﺎﯾﺞ
ﺑﺎ اﺳﺘﻔﺎده از آزﻣﻮن اﺧﺘﺼﺎﺻﯽ رﯾﺎﺿﯽ رﺷﺘﻪ رﯾﺎﺿﯽـ ﻓﯿﺰﯾﮏ، ﺳﺆال اول ﺗﺤﻘﯿﻖ، ﯾﻌﻨﯽ ﺗﺄﺛﯿﺮ
ﺧﺼﻮﺻﯿﺎت آزﻣﻮدﻧﯽﻫﺎ ﺑﺮ وﯾﮋﮔﯽﻫﺎی ﺳﺆال، ﺑﺮرﺳﯽ ﺷﺪ. در ﺗﺤﻠﯿﻞ ﺳﺆاﻻت آزﻣﻮن رﯾﺎﺿﯽ ﺑﻪ
روش ﮐﻼﺳﯿﮏ، 6 ﺳﺆال ﮐﻪ ﻓﺎﻗﺪ ﺑﺮازﻧﺪﮔﯽ ﺑﻮد، ﺣﺬف ﺷﺪ و 49 ﺳﺆال ﺑﺎﻗﯽ ﻣﺎﻧﺪ. ﺑﺎر دﯾﮕﺮ ﺑﺎ ﻣﺪل
ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆالـ ﭘﺎﺳﺦ اﯾﻦ ﺳﺆاﻻت ﺗﺤﻠﯿﻞ ﺷﺪﻧﺪ. ﺑﻪدﻧﺒﺎل آن، ﺑﺎ اﺳﺘﻔﺎده از ﺿﺮﯾﺐ ﻣﻘﯿﺎس
ﭘﺬﯾﺮی، آزﻣﻮن ﺑﺮازﻧﺪﮔﯽ ﺑﺮای ﻫﺮ ﺳﺆال و ﮐﻞ آزﻣﻮن ﻣﺤﺎﺳﺒﻪ ﺷﺪ.ﺳﺆال ﻫﺎﯾﯽ ﮐﻪ ﺿﺮﯾﺐ
ﻣﻘﯿﺎسﭘﺬﯾﺮی ﮐﻢ ﺗﺮ از 0/3 دارﻧﺪ، در ﺣﺪود 23 ﺳﺆال ﺑﻮدﻧﺪ. ﺑﺎ ﺗﻮﺟﻪ ﺗﻌﺪاد زﯾﺎد ﺳﺆالﻫﺎی ﺣﺬف
ﺷﺪﻧﯽ، آﻧﻬﺎ را 5 ﺗﺎ 5 ﺗﺎ ﮐﻨﺎر ﮔﺬاﺷﺘﯿﻢ. در ﻣﺠﻤﻮع، 11 ﺳﺆال ﮐﻨﺎر ﮔﺬاﺷﺘﻪ ﺷﺪ و 44 ﺳﺆال ﺑﺮای
ﺗﺠﺰﯾﻪ و ﺗﺤﻠﯿﻞ ﺑﺎﻗﯽ ﻣﺎﻧﺪ.
ﻫﻢﭼﻨﯿﻦ ﻫﻤﺎنﻃﻮر ﮐﻪ ﺟﺪول 2 ﻧﺸﺎن ﻣﯽدﻫﺪ، ﺿﺮاﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ ﺑﺮآورد ﺷﺎﺧﺺﻫﺎی
دﺷﻮاری، ﻗﺪرت ﺗﺸﺨﯿﺺ در ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ (CTT) ﻣﻘﺎدﯾﺮ ﺑﺴﯿﺎر ﭘﺎﯾﯿﻨﯽ را ﻧﺸﺎن ﻣﯽدﻫﺪ؛ در
ﺣﺎﻟﯽﮐﻪ در ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال– ﭘﺎﺳﺦ (NIRT) ﻫﻤﺒﺴﺘﮕﯽ ﺑﺴﯿﺎر ﺑﺎﻻﯾﯽ ﺑﯿﻦ ﻣﻘﺎدﯾﺮ ﺑﺮآورد
ﺷﺪه اﯾﻦ دو ﭘﺎراﻣﺘﺮ در دو ﮔﺮوه ﻧﻤﻮﻧﻪ وﺟﻮد دارد. اﯾﻦ ﻧﮑﺘﻪ ﺑﯿﺎﻧﮕﺮ آن اﺳﺖ ﮐﻪ ﺑﺮآورد اﯾﻦ
ﺷﺎﺧﺺﻫﺎ در ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ، ﯾﮏ ﺑﺮآورد ﻣﺘﻐﯿﺮ و ﻏﯿﺮﺛﺎﺑﺖ اﺳﺖ؛ وﻟﯽ در NIRT ﭼﻨﯿﻦ ﻧﯿﺴﺖ.
ﻻزم ﺑﻪ ذﮐﺮ اﺳﺖ ﮐﻪ در ﻧﺮماﻓﺰار MSP، ﮐﻪ ﺑﺮای ﺗﺤﻠﯿﻞ ﻣﺪل ﻏﺒﺮﭘﺎراﻣﺘﺮﯾﮏ ﺑﻪﮐﺎر ﻣﯽرود،
Pi ﻣﺤﺒﻮﺑﯿﺖ ﺳﺆال (
Hi ) ﻣﻌﺎدل ﺿﺮﯾﺐ دﺷﻮاری و ﻣﻘﯿﺎسﭘﺬﯾﺮی (
) ﻣﻌﺎدل ﺿﺮﯾﺐ ﺗﺸﺨﯿﺺ در
ﻧﻈﺮ ﮔﺮﻓﺘﻪ ﻣﯽﺷﻮد.
ﺟﺪول 2. ﻣﻘﺎﯾﺴﻪ ﺿﺮاﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ ﺷﺎﺧﺺﻫﺎی ﺳﺆال در CTT و NIRT
ﻪ ﯾ ﻧﻈﺮ
ﺴﻪ ﯾ ﻣﻮرد ﻣﻘﺎ
ت ﺳﺆاﻻ ﺗﻌﺪاد
ﯽ ﺎﺿ ﯾ آزﻣﻮن ر
ﺑﺮازش ی دارا
ﯽ ﻫﻤﺒﺴﺘﮕ ﺐ ﺿﺮﯾ
ﺑﺮآورد ﺷﺎﺧﺺ
ی ﺎ ﭘﺎراﻣﺘﺮ دﺷﻮار ﯾ
ی دار ﯽ ﺳﻄﺢ ﻣﻌﻨ
ﯽ ﺐ ﻫﻤﺒﺴﺘﮕ ﯾﺮﺿ
ﺎﯾ ﺑﺮآورد ﺷﺎﺧﺺ
ﻗﺪرت ﭘﺎراﻣﺘﺮ
ﯿ ﺗﺸﺨ
ﺳﻄﺢ
ﺺ
ی دار ﯽ ﻣﻌﻨ
0/039 0/299 0/019 0/335 49 CTT
0/000 0/941 0/000 0/989 44 NIRT
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 51
ﻣﻘﺎﯾﺴﻪ ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ: ﺑﻪﻣﻨﻈﻮر ﺑﺮرﺳﯽ ﺛﺒﺎت ﺷـﺎﺧﺺ ﯾـﺎ ﻣﺤﺒﻮﺑﯿـﺖ ﺳـﺆال از ﺿـﺮﯾﺐ
ﻫﻤﺒﺴﺘﮕﯽ ﻧﻘﻄﻪای ﯾﺎ ﺑﻪﻋﺒﺎرﺗﯽ ﺿﺮﯾﺐ ﻫﻤﺒـﺴﺘﮕﯽ ﭘﯿﺮﺳـﻮن اﺳـﺘﻔﺎده ﺷـﺪ. ﻧﺘـﺎﯾﺞ ﻣﻘﺎﯾـﺴﻪ ﺿـﺮاﯾﺐ
ﻫﻤﺒﺴﺘﮕﯽ در اﯾﻦ دو ﻧﻈﺮﯾﻪ، در ﺟﺪول 3 آﻣﺪه اﺳﺖ.
ﺟﺪول 3. ﻣﻘﺎﯾﺴﻪ ﺿﺮاﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ ﺷﺎﺧﺺﯾﺎ ﻣﺤﺒﻮﺑﯿﺖ ﺳﺆال
(دﺷﻮاری ﺳﺆال) در دو ﮔﺮوه ﻧﻤﻮﻧﻪ ﺑﺎ روش CTT و NIRT
روش ﻣﻘﺎﯾﺴﻪ ﺗﻌﺪاد ﺳﺆاﻻت ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ rpbis ﺳﻄﺢ ﻣﻌﻨﯽداری
0/019 0/335 48 CTT
0/000 0/989 45 NIRT
ﺑﺮرﺳﯽ ﺟﺪول ﻓﻮق، ﻧﺸﺎن ﻣﯽدﻫﺪ ﮐﻪ ﻫﻤﺒﺴﺘﮕﯽ ﭘﺎراﻣﺘﺮ ﻣﺤﺒﻮﺑﯿﺖ ﺳﺆال (دﺷﻮاری ﺳـﺆال) در
ﻧﻈﺮﯾﻪ NIRT ﺑﺴﯿﺎر ﺑﺎﻻ ﺑﻮده (rpbis= 0/989) و ﺗﻔﺎوت ﻓﺎﺣﺸﯽ ﺑـﯿﻦ اﯾـﻦ ﺿـﺮﯾﺐ ﻫﻤﺒـﺴﺘﮕﯽ در
NIRT و CTT وﺟﻮد دارد ﮐﻪ ﺑﯿﺎﻧﮕﺮ ﯾﮑﺴﺎن ﺑـﻮدن ﻣﻘـﺎدﯾﺮ ﺑـﺮآورده ﺷـﺪه ﻣﺤﺒﻮﺑﯿـﺖ ﺳـﺆال در
NIRT اﺳﺖ.
از آزﻣﻮن t واﺑﺴﺘﻪ ﻧﯿﺰ ﺑﺮای ﻧﺸﺎن دادن ﺗﻔﺎوت دو ﻧﻈﺮﯾﻪ در ﺑﺮآورد ﺷﺎﺧﺺ ﯾﺎ ﻣﺤﺒﻮﺑﯿﺖ ﺳﺆال
اﺳﺘﻔﺎده ﺷﺪ. ﺟﺪول 3 ﻣﻘﺎﯾﺴﻪ اﯾﻦ دو ﻧﻈﺮﯾﻪ را ﻧﺸﺎن ﻣﯽدﻫﺪ.
ﺟﺪول4. ﻣﻘﺎﯾﺴﻪ دو ﻧﻈﺮﯾﻪ CTT و NIRT از ﻧﻈﺮ ﺷﺎﺧﺺﯾﺎ ﻣﺤﺒﻮﺑﯿﺖ ﺳﺆاﻻت ﺑﺎ
اﺳﺘﻔﺎده از آزﻣﻮن t در دو ﮔﺮوه ﻧﻤﻮﻧﻪ
ﻣﯿﺎﻧﮕﯿﻦ ﺳﻄﺢ دﺷﻮاری
ﺧﻄﺎی اﺳﺘﺎﻧﺪارد
ﻣﯿﺎﻧﮕﯿﻦ ﺳﻄﺢ
دﺷﻮاری
ﺴﻪ ﯾ ﻘﺎ روش ﻣﻮرد ﻣ
ﺗﻌﺪاد
ت ﺳﺆاﻻ
A ﮔﺮوه
B ﮔﺮوه
A ﮔﺮوه
B ﮔﺮوه
t آزﻣﻮن
) d.f (ی درﺟﻪ آزاد
دار ﯽ ﺳﻄﺢ ﻣﻌﻨ
49 CTT
0/3802
sd=0/28
0/1105
sd=0/15
0/001 48 6/34 0/017 0/037
44 NIRT
1/1098
sd=1/13
1/1045
sd=1/14
/388 43 0/79 0/17 0/17
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
52
ﻫﻤﺎنﻃﻮر ﮐﻪ ﻣﻼﺣﻈﻪ ﻣﯽﺷﻮد، ﻣﯿﺎﻧﮕﯿﻦ ﺳﻄﺢ دﺷﻮاری در دو ﮔﺮوه CTT ﺑﺎ ﯾﮑﺪﯾﮕﺮ ﻣﺘﻔﺎوت
ﺑﻮد؛ در ﺣﺎﻟﯽﮐﻪ اﯾﻦ ﻣﯿﺰان در NIRT ﺗﻘﺮﯾ ًﺒﺎ ﯾﮑﺴﺎن اﺳﺖ. ﺧﻄﺎی اﺳﺘﺎﻧﺪارد ﻣﯿﺎﻧﮕﯿﻦ ﺳﻄﺢ دﺷﻮاری
ﻧﯿﺰ در دو ﮔﺮوه در CTT ﻣﺘﻔﺎوت ﺑﻮده اﺳﺖ؛ در ﺣﺎﻟﯽﮐﻪ اﯾﻦ ﻣﯿﺰان در NIRT ﺑـﺴﯿﺎر ﻧﺰدﯾـﮏ ﺑـﻪ
ﯾﮑﺪﯾﮕﺮ اﺳﺖ. آزﻣﻮن t در CTT ﻧﺸﺎن ﻣﯽدﻫﺪ ﮐﻪ ﺗﻔﺎوت ﺑـﯿﻦ دو ﺑـﺮآورد ﺳـﻄﺢ دﺷـﻮاری در دو
ﮔﺮوه آزﻣﻮدﻧﯽ ﻣﻌﻨﯽدار اﺳﺖ؛ ﯾﻌﻨﯽ ﻣﻘﺎدﯾﺮ ﺑﺮآورد ﺷﺪه در دو ﮔـﺮوه ﺑـﺎ ﯾﮑـﺪﯾﮕﺮ ﺗﻔـﺎوت ﻣﻌﻨـﯽدار
دارﻧﺪ؛ در ﺣﺎﻟﯽﮐﻪ در NIRT آزﻣﻮن t واﺑﺴﺘﻪ ﻧﺸﺎن ﻣﯽدﻫﺪ ﮐﻪ ﺗﻔﺎوت ﺑﯿﻦ دو ﮔﺮوه از ﻧﻈﺮ ﺑﺮآورد
ﭘﺎراﻣﺘﺮ دﺷﻮاری، ﻣﻌﻨﯽدار ﻧﯿﺴﺖ و ﻣﻘﺎدﯾﺮ ﺑﺮآورد ﺷـﺪه ﭘـﺎراﻣﺘﺮ دﺷـﻮاری در دو ﮔـﺮوه ﻣﺘﻔـﺎوت از
آزﻣﻮدﻧﯽﻫﺎ در NIRT ﯾﮑﺴﺎن ﯾﺎ ﺗﻘﺮﯾ ً ﺒـﺎ ﯾﮑـﺴﺎن اﺳـﺖ. اﯾـﻦ ﻣـﺴﺌﻠﻪ ﺑﯿـﺎﻧﮕﺮ ﺗﺄﺛﯿﺮﻧﺎﭘـﺬﯾﺮی ﺑـﺮآورد
ﻣﺤﺒﻮﺑﯿﺖ ﺳﺆال از وﯾﮋﮔﯽﻫﺎی آزﻣﻮدﻧﯽﻫﺎ در ﻧﻈﺮﯾﻪ ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ اﺳﺖ.
از آنﺟﺎ ﮐﻪ در ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ، ﺷﺎﺧﺺ ﻗﺪرت ﺗﺸﺨﯿﺺ ﺳﺆال، ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ ﻧﻘﻄﻪای
اﺳﺖ، در NIRT ﻣﻘﯿﺎس ﭘﺬﯾﺮی، ﻣﻌﺎدل ﺑﺮآورد ﺷﺎﺧﺺ ﯾﺎ ﭘﺎراﻣﺘﺮ ﻗﺪرت ﺗﺸﺨﯿﺺ ﯾﺎ ﺷﯿﺐ ﺳﺆال
(a1) اﺳﺖ. ﺟﺪول 5، ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ آزﻣﻮن رﯾﺎﺿﯽ را در ﺑﺮآورد ﺷﺎﺧﺺ ﻗﺪرت ﺗﺸﺨﯿﺺ در
دو ﮔﺮوه ﻧﻤﻮﻧﻪ در CTT و NIRT ﻧﺸﺎن ﻣﯽدﻫﺪ.
ﺟﺪول 5- ﻣﻘﺎﯾﺴﻪ ﺿﺮاﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ ﺷﺎﺧﺺﯾﺎ ﻣﻘﯿﺎس ﭘﺬﯾﺮی
(ﭘﺎراﻣﺘﺮ ﻗﺪرت ﺗﺸﺨﯿﺺ) ﺳﺆال در دو ﮔﺮوه ﻧﻤﻮﻧﻪ ﺑﺎ روش CTT و NIRT
روش ﻣﻘﺎﯾﺴﻪ ﺗﻌﺪاد ﺳﺆاﻻت ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ rpbis ﺳﻄﺢ ﻣﻌﻨﯽداری
0/034 0/310 49 CTT
0/001 0/941 44 NIRT
ﻫﻤﺎنﻃﻮر ﮐﻪ ﻣﻼﺣﻈﻪ ﻣﯽﺷﻮد، ﺿﺮﯾﺐ ﻫﻤﺒﺴﺘﮕﯽ در CTT ﺑﺮاﺑﺮ0/310 و در NIRT ﺑﺮاﺑﺮ
0/941 اﺳﺖ. اﯾﻦ ﻣﯿﺰان ﻧﺸﺎندﻫﻨﺪه ﻫﻤﺒﺴﺘﮕﯽ ﺑﺴﯿﺎر ﺑﺎﻻ در ﻧﻈﺮﯾﻪ ﻏﯿﺮﭘﺎرﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ (در
ﻣﻘﺎﯾﺴﻪ ﺑﺎ ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ) در ﺑﺮآورد ﺷﺎﺧﺺ ﯾﺎ ﭘﺎراﻣﺘﺮ ﻗﺪرت ﺗﺸﺨﯿﺺ اﺳﺖ.
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 53
ﺟﺪول 6 ـ ﻣﻘﺎﯾﺴﻪ دو ﻧﻈﺮﯾﻪ CTT و NIRT از ﻧﻈﺮ ﺷﺎﺧﺺﯾﺎ ﻣﻘﯿﺎسﭘﺬﯾﺮی (
ﭘﺎراﻣﺘﺮ ﻗﺪرت ﺗﺸﺨﯿﺺ) ﺳﺆال ﺑﺎ اﺳﺘﻔﺎده از آزﻣﻮن t
ﻣﯿﺎﻧﮕﯿﻦ ﺳﻄﺢ
دﺷﻮاری
ﺧﻄﺎی اﺳﺘﺎﻧﺪارد
ﻣﯿﺎﻧﮕﯿﻦ ﺳﻄﺢ
دﺷﻮاری
ﺴﻪ ﯾ روش ﻣﻮرد ﻣﻘﺎ
ﺗﻌﺪاد
ت ﺳﺆاﻻ
A ﮔﺮوه
B ﮔﺮوه
A ﮔﺮوه
B ﮔﺮوه
t آزﻣﻮن
) d.f (ی درﺟﻪ آزاد
دار ﯽ ﺳﻄﺢ ﻣﻌﻨ
49 CTT
0/2777
sd=0/08
0/1441
sd=0/05
0/001 48 9/35 0/009 0/014
44 NIRT
0/7933
sd=0/23
0/7932
sd=0/22
0/898 43 -0/12 0/036 0/037
ﻫﻤﺎنﻃﻮر ﮐﻪ در ﺟﺪول 6 ﻣﻼﺣﻈﻪ ﻣﯽﺷﻮد، در ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ، ﻣﯿﺎﻧﮕﯿﻦ ﺷﺎﺧﺺ ﻗﺪرت
ﺗﺸﺨﯿﺺ در دو ﮔﺮوه ﺗﻔﺎوت زﯾﺎدی داﺷﺘﻪ اﺳﺖ؛ در ﺣﺎﻟﯽﮐﻪ در ﻧﻈﺮﯾﻪ ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ،
ﻣﯿﺎﻧﮕﯿﻦ ﻗﺪرت ﺗﺸﺨﯿﺺ و sd آنﻫﺎ در دو ﮔﺮوه آزﻣﻮدﻧﯽ ﺑﺴﯿﺎر ﻧﺰدﯾﮏ ﺑﻪﯾﮑﺪﯾﮕﺮ اﺳﺖ. ﺧﻄﺎی
اﺳﺘﺎﻧﺪارد ﻣﯿﺎﻧﮕﯿﻦ ﻗﺪرت ﺗﺸﺨﯿﺺ ﻧﯿﺰ در CTT در دو ﮔﺮوه ﻧﻤﻮﻧﻪ، ﻣﺘﻔﺎوت اﺳﺖ؛ وﻟﯽ در
NIRT اﯾﻦ ﻣﻘﺎدﯾﺮ ﺗﻘﺮﯾ ًﺒﺎ ﯾﮑﺴﺎن اﺳﺖ. آزﻣﻮن t در CTT در ﺳﻄﺢ 0/001 ﻣﻌﻨﯽدار اﺳﺖ؛ ﯾﻌﻨﯽ
ﺑﺮآورد ﺷﺎﺧﺺ ﻗﺪرت ﺗﺸﺨﯿﺺ در دو ﻧﻤﻮﻧﻪ در CTT ﺗﻔﺎوت ﻣﻌﻨﯽداری ﺑﺎ ﯾﮑﺪﯾﮕﺮ دارد؛ اﻣﺎ در
NIRT ﺗﻔﺎوت ﺑﯿﻦ دو ﮔﺮوه در ﺑﺮآورد اﯾﻦ ﺷﺎﺧﺺ ﻣﻌﻨﯽدار ﻧﯿﺴﺖ. ﺑﻪﻋﺒﺎرﺗﯽ در ﻧﻈﺮﯾﻪ
ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ ، ﺿﺮﯾﺐ ﻣﻘﯿﺎس ﭘﺬﯾﺮی (ﭘﺎراﻣﺘﺮ ﻗﺪرت ﺗﺸﺨﯿﺺ) ﺛﺎﺑﺖ اﺳﺖ و
ﺗﺤﺖﺗﺄﺛﯿﺮ وﯾﮋﮔﯽﻫﺎی ﮔﺮوه آزﻣﻮدﻧﯽﻫﺎ ﻗﺮار ﻧﻤﯽﮔﯿﺮد و از ﯾﮏ ﮔﺮوه ﺑﻪ ﮔﺮوه دﯾﮕﺮ، ﻣﻘﺎدﯾﺮ آن
ﻣﺸﺎﺑﻪ اﺳﺖ؛ در ﻧﺘﯿﺠﻪ ﻣﻘﺎدﯾﺮ ﺑﺮآوردﺷﺪه در دو ﮔﺮوه، ﺗﻔﺎوت ﻣﻌﻨﯽداری ﺑﺎ ﯾﮑﺪﯾﮕﺮ ﻧﺪارﻧﺪ؛ اﻣﺎ در
ﻧﻈﺮﯾﻪ CTT، ﺗﻔﺎوت ﺑﯿﻦ ﻣﻘﺎدﯾﺮ ﺑﺮآوردﺷﺪه ﺷﺎﺧﺺﻫﺎی ﺳﺆال، زﯾﺎد و ﺗﻔﺎوت ﺑﯿﻦ دو ﮔﺮوه
ﻣﻌﻨﯽدار اﺳﺖ.
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
54
ﺑﺤﺚ و ﻧﺘﯿﺠﻪﮔﯿﺮی
در ﺑﺮرﺳﯽ اول، ﺗﻔﺎوت دو ﻧﻈﺮﯾﻪ از ﻧﻈﺮ ﭘﺎراﻣﺘﺮ ﺳﻄﺢ دﺷﻮاری در ﮐﻼﺳﯿﮏ ﯾﺎ ﻣﺤﺒﻮﺑﯿﺖ
ﺳﺆال ﻧﻈﺮﯾﻪ ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال – ﭘﺎﺳﺦ، ﻣﻮرد ﻣﻄﺎﻟﻌﻪ ﻗﺮار ﮔﺮﻓﺖ و ﻧﺘﺎﯾﺞ زﯾﺮ ﺑﻪ دﺳﺖ
i آﻣﺪ: در ﻣﺪل ﮐﻼﺳﯿﮏ، درﺟﻪ دﺷﻮاری ﺳﺆال ( p
) ﺑﺎ اﻧﺘﺨﺎب ﻧﻤﻮﻧﻪای از آزﻣﻮدﻧﯽﻫﺎ ﺗﻐﯿﯿﺮ ﻣﯽﮐﻨﺪ؛
ﯾﻌﻨﯽ ﯾﮏ ﺳﺆال ﺑﺮای ﮔﺮوه ﻧﻤﻮﻧﻪ ﻗﻮیﺗﺮ،آﺳﺎن و ﺑﺮای ﮔﺮوه ﻧﻤﻮﻧﻪ ﺿﻌﯿﻒﺗﺮ،دﺷﻮار ﺧﻮاﻫﺪ ﺑﻮد؛ در
ﺣﺎﻟﯽﮐﻪ ﺑﺮرﺳﯽﻫﺎ ﻧﺸﺎن داد ﮐﻪ در ﻧﻈﺮﯾﻪ ﻣﺪل ﻏﯿﺮﭘﺎرﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، ﺿﺮﯾﺐ ﻣﻘﯿﺎسﭘﺬﯾﺮی
Hi)، ﻧﺎﻣﺘﻐﯿﺮ و ﺗﻘﺮﯾ ًﺒﺎ ﺛﺎﺑﺖ اﺳﺖ و ﻣﯽﺗﻮان ﻧﺤﻮه ﭘﺎﺳﺨﮕﻮﯾﯽ اﻓﺮادی را ﮐﻪ ً ﻗﺒﻼ ﺑﺎ آن ﺳﺆال ﻣﻮاﺟﻪ
)
ﻧﺸﺪهاﻧﺪ، در اﯾﻦ ﻧﻈﺮﯾﻪ ﭘﯿﺶﺑﯿﻨﯽ ﮐﺮد. در ﺿﻤﻦ، اﯾﻦ ﺷﺎﺧﺺ ﺗﺤﺖﺗﺄﺛﯿﺮ وﯾﮋﮔﯽﻫﺎی آزﻣﻮدﻧﯽﻫﺎ ﯾﺎ
ﺳﺆاﻻت دﯾﮕﺮ ﺗﻐﯿﯿﺮ ﻧﻤﯽﮐﻨﺪ.در اﯾﻦ زﻣﯿﻨﻪ ﻣﻮﮐﻦ (1997) ﺑﻪ ﻧﺘﺎﯾﺞ ﻣﺸﺎﺑﻪ دﺳﺖ ﯾﺎﻓﺖ. ﺑﺮ اﺳﺎس
ﻣﯿﺰان دﺷﻮاری آزﻣﻮن در ﻧﻈﺮﯾﻪ ﮐﻼﺳﯿﮏ، ﻧﺴﺒﺖ ﭘﺎﺳﺦﻫﺎی ﺻﺤﯿﺢ و ﻧﻤﺮات اﻓﺮاد ﮔﺮوه ﻧﻤﻮﻧﻪ ﺗﻐﯿﯿﺮ
ﻣﯽﮐﻨﺪ و ﺑﺮﺣﺴﺐ ﻣﯿﺰان دﺷﻮاری آزﻣﻮن، ﺗﻮاﻧﺎﯾﯽ اﻓﺮاد، ﺑﯿﺸﯿﻨﻪ ﯾﺎ ﮐﻤﯿﻨﻪ ﺑﺮآورد ﻣﯽﺷﻮد؛ وﻟﯽ در
ﻧﻈﺮﯾﻪ ﻣﺪل ﻏﯿﺮﭘﺎرﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، ﺿﺮﯾﺐ ﻣﻘﯿﺎسﭘﺬﯾﺮی، ﺑﺪون ﺗﺄﺛﯿﺮ از ﻣﯿﺰان ﺗﻮاﻧﺎﯾﯽ اﻓﺮاد
ﺑﺮآورد ﻣﯽﺷﻮد و وﯾﮋﮔﯽﻫﺎی ﺳﺆاﻻت آزﻣﻮن، ﺗﺄﺛﯿﺮی ﺑﺮ ﻣﻘﺪار ﺑﺮآورد ﺷﺪه ﻧﺪارد. رﻣﺰی
(1997) ﺗﺤﻠﯿﻞﻫﺎﯾﯽ را ﺑﺎ اﺳﺘﻔﺎده از ﻣﺪلﻫﺎی ﻫﻤﮕﻨﯽ ﯾﮑﻨﻮاﺧﺘﯽ و ﻫﻤﮕﻨﯽ ﯾﮑﻨﻮاﺧﺘﯽ ﺟﻔﺘﯽ اﻧﺠﺎم
داد و ﺑﺮرﺳﯽ ﺗﺤﻘﯿﻘﯽ وی ﻧﯿﺰ ﻣﻄﺎﻟﺐ ﻓﻮق را ﺗﺄﯾﯿﺪ ﮐﺮد.
در ﺑﺮرﺳﯽ ﺳﺆال دوم ﺗﺤﻘﯿﻖ، ﯾﻌﻨﯽ ﺗﻔﺎوت دو ﻧﻈﺮﯾﻪ از ﻧﻈﺮ ﺷﺎﺧﺺ ﻗﺪرت ﺗﺸﺨﯿﺺ ﺳﺆال
در ﮐﻼﺳﯿﮏ و ﺿﺮﯾﺐ ﻣﻘﯿﺎسﭘﺬﯾﺮی، ﻧﺘﺎﯾﺞ زﯾﺮ ﺑﻪدﺳﺖ آﻣﺪ: ﺷﺎﺧﺺ ﻗﺪرت ﺗﻤﯿﺰ در ﻧﻈﺮﯾﻪ
ﮐﻼﺳﯿﮏ اﻧﺪازهﮔﯿﺮی، ﻣﺎﻧﻨﺪ ﺷﺎﺧﺺ دﺷﻮاری ﺳﺆال، از ﻧﻤﻮﻧﻪﻫﺎی ﻣﺨﺘﻠﻒ آزﻣﻮدﻧﯽ ﺗﺄﺛﯿﺮات ﻣﺘﻔﺎوﺗﯽ
را ﻣﯽﭘﺬﯾﺮد. اﯾﻦ ﻧﻈﺮﯾﻪ ﺑﺮآوردﻫﺎﯾﯽ واﺑﺴﺘﻪ ﺑﻪ ﻧﻤﻮﻧﻪ اراﺋﻪ ﻣﯽﮐﻨﺪ و ﺗﺤﺖﺗﺄﺛﯿﺮ ﻧﺎﻫﻤﮕﻮﻧﯽ ﮔﺮوه، اﯾﻦ
ﻣﺸﺨﺼﻪ اﻓﺰاﯾﺶ ﻣﯽﯾﺎﺑﺪ؛ در ﺣﺎﻟﯽﮐﻪ در ﻧﻈﺮﯾﻪ ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال ـ ﭘﺎﺳﺦ، ﺿﺮﯾﺐ ﻣﻘﯿﺎسﭘﺬﯾﺮی،
ﺷﺎﺧﺼﯽ اﺳﺖ ﮐﻪ ﻣﯿﺰان اﻃﻼﻋﯽ را ﮐﻪ ﯾﮏ ﺳﺆال درﺑﺎره ﺳﻄﺢ ﺗﻮاﻧﺎﯾﯽ ﻣﻮرد ﺳﻨﺠﺶ اراﺋﻪ ﻣﯽﮐﻨﺪ،
ﻧﺸﺎن ﻣﯽدﻫﺪ. ﺿﺮﯾﺐ ﻣﻘﯿﺎسﭘﺬﯾﺮی در ﻧﻈﺮﯾﻪ NIRT، ﻧﺎﻣﺘﻐﯿﺮ اﺳﺖ و ﺑﻪ ﮔﺮوهﻫﺎی ﻣﺨﺘﻠﻒ
آزﻣﻮدﻧﯽﻫﺎ ﻗﺎﺑﻞ ﺗﻌﻤﯿﻢ اﺳﺖ. ﺗﻐﯿﯿﺮﻧﺎﭘﺬﯾﺮی ﯾﮑﯽ از ﻣﻬﻢﺗﺮﯾﻦ وﯾﮋﮔﯽﻫﺎی اﯾﻦ ﻧﻈﺮﯾﻪ اﺳﺖ (ﻣﻮﻟﻨﺎرو
1997 و ﺗﺮﺳﮑﻮﺳﮑﯽ 1999 ).
www.SID.irArchive of SID
ﻣﻘﺎﯾﺴﻪ ﻣﺪل اﻧﺪازهﮔﯿﺮی ﮐﻼﺳﯿﮏ و ﻣﺪل ﻏﯿﺮﭘﺎراﻣﺘﺮﯾﮏ... 55
ﻣﻨﺎﺑﻊ
آﻟﻦ، ﻣﺮیﺟﯽ؛ ﯾﻦ، وﻧﺪیام (1374). ﻣﻘﺪﻣﻪای ﺑﺮ ﻧﻈﺮﯾﻪﻫﺎی اﻧﺪازهﮔﯿـﺮی (روانﺳـﻨﺠﯽ)، ﺗﺮﺟﻤـﻪ ﻋﻠـﯽ
دﻻور، ﺗﻬﺮان: اﻧﺘﺸﺎرات ﺳﻤﺖ (1979).
اﻓﺮوز، ﻏﻼﻣﻌﻠﯽ؛ ﻫﻮﻣﻦ، ﺣﯿﺪرﻋﻠﯽ (1375). روش ﺗﻬﯿﻪ آزﻣﻮن ﻫﻮش: ﻫﻮشآزﻣﺎی ﺗﻬﺮان ـ اﺳـﺘﻨﻔﻮرد ـ
ﺑﯿﻨﻪ (T.S.B)، ﺗﻬﺮان: ﻣﻮﺳﺴﻪ اﻧﺘﺸﺎرات و ﭼﺎپ داﻧﺸﮕﺎه ﺗﻬﺮان.
ﺛﺮﻧﺪاﯾﮏ، راﺑﺮت (1375). روانﺳﻨﺠﯽ ﮐﺎرﺑﺮدی، ﺗﺮﺟﻤﻪ ﺣﯿﺪرﻋﻠﯽ ﻫـﻮﻣﻦ. ﺗﻬـﺮان: اﻧﺘـﺸﺎرات داﻧـﺸﮕﺎه
ﺗﻬﺮان.
ﺳﯿﻒ، ﻋﻠﯽاﮐﺒﺮ (1380). روشﻫﺎی اﻧﺪازهﮔﯿﺮی و ارزﺷﯿﺎﺑﯽ آﻣﻮزﺷﯽ. ﻧﺸﺮ دوران.
ﻣﻮﻟﻦ آﯾﺮ، اﯾﻮدﺑﻠﯿﻮ؛ ﺳﯿﺠﺖﺳﻤﺎ، ﮐﻼس (1385). ﻣﻘﺪﻣﻪ ﺑﺮ ﺗﺌﻮری ﻧﺎﭘﺎراﻣﺘﺮﯾﮏ ﺳﺆال – ﭘﺎﺳﺦ (ﺑﻪﻫﻤﺮاه
ﻧﺮماﻓﺰار)، ﺗﺮﺟﻤﻪ ﺳﻠﯿﻤﺎن ذواﻟﻔﻘﺎریﻧﺴﺐ: ﻣﺸﻬﺪ: اﻧﺘﺸﺎرات ﮐﺘﺎﺑﺨﺎﻧﻪای راﯾﺎﻧﻪای (2002).
Gulliksen, H. (1950). Theory of Mental tests. Newyork: John Wiley &
Sons.
Hambleton, R. K. (1989). Principles and selected applications of Item
Response Theory. In R. Linn (Ed), Educational Measurement (3rd end).
Newyork: Memillan. PP: 147-200.
Hambleton, R. K. & Cook, L. L. (1977). Latent Trait models and their use
in the analysis of Educational test data. Journal of Educational Measurement.
14(2), P: 75-94.
Hambleton, R. K. & Swaminathan, H. (1985). Item Response Theory:
Principles and Applications, Boston: Kluwer.
Hambleton, R.K ; Jones, R. W. (1993). Comparison of Classical Test
Theory and Item Response Theory and Their Applications to Test
Development. Educational Measurement: Issues and Practice. 12(3), 38-47.
Hambleton, R. K. & Vander Linden, Wim. J. (1982). Advance in Item
Response Theory and Applications: An Introduction, Applied Psychplogical
Measurement. 6(4), 373- 378.
Lord, F. M. & Novick, M. R. (1968). Statistical Theories of mental test
scores.Reading, MA: Addison-Wesley.
Lord, F. M. (1980). Applications of Item Response Theory to Practice
Testing Problems, Hillsdale, N.J: Lawrence Erlbaum.
www.SID.irArchive of SID
ﻓﺼﻠﻨﺎﻣﮥ ﻧﻮآورﯾﻬﺎی آﻣﻮزﺷﯽ، ﺷﻤﺎرۀ 18، ﺳﺎل ﭘﻨﺠﻢ، زﻣﺴﺘﺎن 1385
56
Mokken, R.J. (1997). Nonparametric models for dichotomous responses.
In: Hambleton, R.K. and Van der Linden, W.J. (Ed’s). Handbook of Modern
Item Response Theory. New York-Berlin: Springer-Verlag, pp. 351-367.
Molenaar, I. W. (1997). Nonparametric models for dichotomous responses.
In: Hambleton, R.K. and Van der Linden, W.J. (ed’s). Handbook of Modern
Item Response Theory. New York-Berlin: Springer-Verlag, pp. 369-379
Ramsey, J . (1997). Nonparametric Models for Dichotomous Responses.
In: Hambleton, R.K. and Van der Linden, W.J. (ed’s). Handbook of Modern
Item Response Theory. New York-Berlin: Springer-Verlag, pp. 369-379
Truskosky, D.M. (1999). An empirical examination of Classical Test
Theory and Item Response Theory parameters: implications for research and
practice in small- and large- sample assessment, Department of Psychology in
the graduate school Southern Illinois university at Carbondale.
Wright, B.D. & Stone, M.H. (1979). Best Test Design. Chicago: MESA
Press.
www.SID.ir