محتوی اولیه و پیشنهادی به صورت مقدماتی برای روانسنجی2
روايي وابسته به ملاك: روايي پيش بين
روايي پيش بيني ويژه آزمون هايي است كه براي پيش بيني موفقيت افراد در امور تحصيلي و شغلي به كار مي روند.
براي مثال، آزمون هاي ورودي دانشگاه ها به منظور پيش بيني احتمال موفقيت تحصيلي داوطلبان در دانشگاه به كار مي روند.
در يك امتحان استخدامي، سوال هاي آزموني كه براي گزينش داوطلبان اجرا مي شود متغير پيش بين و موفقيت و كارايي انتخاب شدگان در شغل آينده متغير ملاك است.
آزمون سنجش آمادگي براي ورود به كلاس اول دبستان كه در مورد كودكان 6 ساله اجرا مي شود، متغير پيش بين و نمره هايي كه دانش آموزان در كلاس اول مي گيرند متغير ملاك است.
روايي وابسته به ملاك: روش تعيين روايي پيش بين
فرض كنيد بخواهيم تعيين كنيم كه يك آزمون ورودي دانشگاه داراي روايي پيش بين است يه نه، بايد رابطه بين نمرات داوطلبان ورود به دانشگاه را در اين آزمون با نمرات آنان در درس هايي كه بعدا در دانشگاه مي گيرند، تعيين كنيم. و ضريب همبستگي بين آن ها را به دست آوريم.
گاه تبديل متغيري كه بايد پيش بيني شود به صورت عددي به سادگي امكان پذير نيست. براي مثال، اگر بخواهيم يك آزمون يا يك پرسش نامه انتخاب معلمي بسازيم، بايد يك وسيله اندازه گيري موفقيت در شغل معلمي نيز درست كنيم تا بتوانيم عملكرد فرد را در اين دو نوع وسيله اندازه گيري با هم مقايسه كنيم. براي تعيين ميزان موفقيت معلمان در فعاليت هاي آموزشي هم باي از نظر مديران، همكاران، دانش آموزان و دانشجويان استفاده كرد و هم از ميزان پيشزفت تحصيلي دانش آموزان و دانشجويان آن معلمان.
روايي وابسته به ملاك: روايي همزمان
روايي همزمان نوعي روايي ملاكي است كه در آن به جاي تعيين رابطه بين دو آزمون پس از گذشت يك فاصله زماني، رابطه بين دو آزمون به طور همزمان تعيين مي شود. هدف از تعيين روايي همزمان بين دو آزمون اين است كه معلوم سازيم آيا مي توان يكي از دو آزمون را به جاي ديگري مورد استفاده قرار دهيم يا نه.
گنجاندن نمونه هايي از تكاليف شغلي در آزمون استخدامي موجب مي شود كه روايي ةمزمان ازمون افزايش يابد. روان شناسان صنعتي، اغلب بر اساس پاره اي از اطلاعات محدود ناگزيرند داوطلباني را براي مشاغل مختلف انتخاب كنند. آزمون هايي كه براي اين منظور ساخته مي شوند بايد نمونه هايي از رفتار آزمودني ها را كه با وظايف شغلي مورد نظر زابطه دارند اندازه گيري كنند.
روايي وابسته به ملاك: روايي همزمان
يكي ديگر از موارد كاربرد روايي همزمان، استفاده از الگوهاي علايق شغلي كساني است كه از مشاغل خود رضايت دارند به عنوان متغير ملاك و مقايسه الگوهاي علايق شغلي ساير افراد(داراي مشاغل متفتوت) با اين الگوها. پسش هايي كه دو گروه آزمودني مذكور را به گونه معني داري از هم تفكيك مي كنند براي تدوين پرسش نامه فرم اصلي انتخاب مي شوند.
به عنوان مثال ديگر، يك آزمون استعداد فني در مورد گروهي از تكنسين ها و مهندسان مشاغل فني و گروه مشابهي از آزمودني ها كه در مشاغل غير فني(مثلا اداري و دفتري) اشتغال دارند اجرا مي شود. اگر ميانگين نمره هاي افراد گروه اول به گونه معني داري بالاتر از ميانگين نمره هاي گروه دوم باشد، گفته مي شود كه آزمون داراي روايي همزمان است.
روايي وابسته به ملاك: روش تعيين روايي همزمان
در تعيين روايي همزمان، هنگام اندازه گيري متغير پيش بين، علاوه بر اين متغير، متغر ملاك نيز موجود است. در حالي كه در تعيين روايي پيش بيني، متغير ملاك در آيندن اندازه گيري مي شود. به سخن ديگر، اگر به عوض مقايسه نمرات يك آزمون با نمرات آزمون ديگري كه در اينده به دست ]واهند آمد، نمرات آزمون اول را با نمرات آزمون ديگري كه همزمان با آزمون اول يا در فاصله كوتاهي بعد از آن اجرا مي شود مقايسه كنيم، رابطه حاصل بين اين دو آزمون همزمان اجرا شده، نشان دهنده روايي همزمان است.
براي مثال، رابط بين نمران حاصل از يك پرسش نامه و تشخيص متخصص براي تشخيص يك بيماري رواني مثال از روايي همزمان پرسش نامه است.
روايي وابسته به ملاك: مقايسه روايي همزمان و پيش بين
در روايي پيش بين، نمرات آزمون اولي واقعا براي پيش بيني نمراه فرد در آزمون دوم استفاده مي شود، اما در روايي همرمان هدف اصلي پيش بيني نيست بلكه شناسايي يك آزمون مناسب براي آزمون ملاك است كه بتوانيم آن را با اطمينان به جاي آزمون ملاك به كار ببريم.
آزمون پيش بين بايد با آزمون ملاك رابطه بالايي داشته باشد و اجراي آن نسبت به آزمون ملاك از لحاظ اقتصادي و زماني به صرفه تر باشد.
روايي وابسته به ملاك: ضريب روايي ملاكي
رابطه بين آزمون و متغير ملاك به صورت ضريب همبستگي بيان مي شود كه آن را ضريب روايي مي نامند. براي تعيين ضريب روايي ملاكي آزمون كافي است بين نمره هاي آزمون گروه نمونه اي از آزمودني ها و نمره هاي ملاك آنان همبستگي محاسبه شود.
براي اين كه معلوم شود اين ضرايب روايي تا چه اندازه با معني هستند، قاعده قطعي وجود ندارد. در عمل به ندرت ممكن است ضريب روايي يك ازمون از 0/60 بالاتر باشد، بتابراين ضرايب روايي 0/30 و 0/40 ضرايب نسبتا بالايي به شمار مي روند. يك ضريب همبستگي در صورتي از نظر آماري معني دار است كه احتمال به دست آوردن تصادفي آن كمتر از 5 درصد باشد.
روايي وابسته به ملاك: ضريب روايي ملاكي
در پيش بيني موفقيت در دانشگاه (به عنوان متغير ملاك)علاوه بر نمرات آزمون ورودي به دانشگاه ( به عنوان متغير پيش بين)ممكن است متغيرهاي متعددي دخيل باشند لذا اين سوال باقي مي ماند كه چه ميزان از تغييرات موفقيت دانشگاهي به وسيله ازمون مذكور تبيين مي شود؟
مجذور ضريب اعتبار پيش بين آزمون، درصد تغييرات متغير ملاك را كه به وسيله آزمون پيش بين تبيين مي شود نشان مي دهد. براي مثال،اگر همبستگي بين نمره نهايي آزمون ورودي و شاخص موفقيت تحصيلي در دانش گاه، 0/40 باش مي توانيم بگوييم كه 16 درصد تغييرات موفقيت تحصيلي در دانشگاه به وسيله نمرات آزمون ورودي تبييت مي شود و 84 درصد تغييرات به عوامل ناشناخته ديگري مربوط است كه تبيين نشده اند.
پيش بيني متغير ملاك از روي نمره آزمون
يكي از موارد مهم ضريب روايي پيش بين آزمون اين است كه از روي نمره آزمون پيش بين مي توان نمره متغير ملاك را پيش بيني كرد. براي اين كار لازم است معادله رگرسيون براي پيش بيني متغير ملاك از روي متغير پيش بين را تهيه كنيم. با در دست داشتن معادله رگرسيون و خطاي معيار برآورد(standard error of estimate)، مي توان از روي نمره آزمون پيش بين،حدود نمره متغير ملاك را برآورد كرد. اگر نمره پيش بيني شده ملاك براي فرد الف را به عنوان ميانگين توزيع نمره هاي ملاك آزمودني هايي كه در متغير پيش بيني نمره اي برابر نمره فرد الف گرفته اند فرض كنيم، در اين صورت انحراف معيار اين توزيع شاخصي از متوسط خطاي پيش بيني است. اين شاخص كه خطاي معيار برآورد ناميده مي شود، از رابطه زير به دست مي آيد.
پيش بيني متغير ملاك از روي نمره آزمون
خطاي معيار برآورد:
عناصر اين رابطه عبارتند از:
= خطاي معيار برآورد
S= انحراف معيار نمره هاي ملاك
R = ضريب همبستگي گشتاوري بين نمره هاي ملاك با نمره هاي آزمون(ضريب روايي پيش بين)
پيش بيني متغير ملاك از روي نمره آزمون
محاسبه خطاي معيار برآورد: مثال عددي
فرض كنيد معادله رگرسيون براي پيش بيني متغير ملاك و معدل امتحانات كلاس اول دبستان از روي متغير پيش بين(نمره هاي سنجش آمادگي) به صورت زير نوشته شده است.
در اين معادله نمره پيش بيني شده ملاك و x نمره آزمون پيش بيني است. اگر ضريب اعتبار پيش بيني آزمون سنجش آمادگي برابر 0/60 باشد، مي خواهيم معدل امتحانات كلاس اول كودكي را كه در آزمون سنجش آمادگي 15 گرفته است در سطح اطمينان 95 درصد پيش بيني كنيم. در ص.رتي كه بدانيم انحراف معيار نمره هاي معدي امتحاني آزمودني هاي گروه نمونه اي كه اين آزمون در مورد آنان اجرا شده است 2/2 باشد.
-
پيش بيني متغير ملاك از روي نمره آزمون
محاسبه خطاي معيار برآورد:
- نمره متغير ملاك بر اساس معادله رگرسيون
- برآورد حدود نمره واقعي آزمودني در كلاس اول در سطح اطمينان 95 درصد
13.5±1.76*1.96 = 13.5±3.5
بنابراين نمره واقعي اين كودك با احتمال 95 درصد بين 10 تا 17 خواهد بود. چون ملاك قبولي در كلاس اول ابتدايي داشتن حداقل معدل 100 است، بنابراين با اطمينان 95 درصد مي توان پيش بيني كرد كه اين كودك در كلاس اول دبستان موفق خواهد شد.
عوامل موثر بر روايي ملاكي
ضريب روايي ملاكي آزمون هايي كه به روش هاي مختلف و تحت شرايط متفاوت به دست آمده اند، حتي اگر اندازه آن ها يكسان هم باشد، از ارزش يكساني برخوردار نيستند زيرا ضرايب روايي وابسته به ملاك، تحت تاثير عوامل مختلفي قرار مي گيرند. بنابراين مصرف كننده آزمون ها در انتخاب آزمون هاي رواني براي هدف هاي خود بايد همه عوامل موثر در ضرايب روايي ملاكي را به دقت بررسي و مورد توجه قرار دهند.
عوامل موثر بر روايي ملاكي: تفاوت هاي گروهي
اعتبار وابسته به ملاك يك آزمون بر حسب خصايص افرادي كه مبناي برآورد روايي ملاكي آزمون بوده اند، تفاوت مي كند.
تفاوت بين گروه هاي آزمودني از نظر متغيرهايي مانند جنسيت، سن، و صفات شخصيت- كه متغيرهاي تعديل كننده ناميده مي شوند- ممكن است همبستگي بين آزمون و متغير ملاك را تحت تاثير قرار دهند.
درجه ناهمگوني گرون نمونه مورد آزمايش از نظر متغير ملاك نيز مي تواند اندازه ضريب محاسبه شده را تحت تاثير قرار دهد. معمولا در يك گروه همگون يعني گروهي كه دامنه تغيير نمره هاي آن ها در متغير ملاك كم است، ضريب همبستگي كمتر است. چون در عمل ضريب همبستگي همواره تابعي از دو متغير است، بنابراين پايين بودن دامنه تغيير نمره ها در هر يك از متغيرهاي ملاك و پيش بين موجب مي شود كه ضريب اعتبار آزمون كاهش يابد.
عوامل موثر بر روايي ملاكي: تفاوت هاي گروهي
چون اندازه ضريب اعتبار بر حسب ماهيت گروه آزمودني تغيير مي كند، لازم است آزموني كه روايي ملاكي آن در مورد گروه خاصي از آزمودني ها مشخص شده است، در مورد گروه نمونه ديگري از آزمودني ها اجرا و كجددا روايي ملاكي آن در مورد گروه جديد برآورد شود. اين عمل را وارسي ملاكي(cross validation) مي نامند.
بنابراين وارسي روايي مستلزم آن است كه آزمون در مورد گروه نمونه ديگري اجرا و ضريب روايي ملاكي آن بر اساس آن برآورد شود، تا معلوم گردد كه ضريب روايي گزارش شده آزمون تا چه اندازه با ضريب روايي جديد همخواني دارد. معمولا بر اثر برخي عوامل تصادفي مقدار ضريب روايي آزمون در وارسي روايي كاهش مي يابد. در نتيجه ضريب همبستگي محاسبه شده بين آزمون و متغير ملاك در مرحله وارسي روايي در مقايسه با ضريب همبستگي اوليه، شاخص مناسب تري براي روايي ملاكي آزمون است.
در هر حال، ضريب روايي محاسبه شده از طريق روش وارسي روايي نشان خواهد داد كه روايي ملاكي آزمون را تا چه اندازه مي توان در مورد گروه هاي ديگر تعميم داد.
عوامل موثر بر روايي ملاكي: طول آزمون
روايي ازمون هم مانند اعتبار آن به طور مستقيم از طول آزمون تاثير مي پذيرد. زيرا به طور كلي هر چه تعداد سوال هاي آزمون بيشتر باشد، واريانس آن بيشتر است. براي اطلاح ضريب روايي آزمون براي كاهش اثز محدوديت تعداد سوال هاي مي توان همان روشي را كه در مورد اعتبار آزمون مورد بحث قرار گرفت، به كار بست. اما چون استفاده از فرمول اصلاح ضريب اعتبار مستلزم وجود شرايط ويژه است، بنابراين در عمل كمتر مي توان از آن استفاده كرد.
عوامل موثر بر روايي ملاكي: روايي و اعتبار متغير ملاك
روايي آزمون نه تنها از ضرايب اعتبار آزمون هاي ملاك و پيش بين، بلكه هم چنين از روايي آزمون ملاك كه براي اندازه گيري متغير ملاك به كار رفته است نيز تاثير مي پذيرد.
گاهي آزمون ملاك، روايي كمي دارد و يا به سبب روش نامناسبي كه براي اندازه گيري متغير ملاك به كار مي رود، اهندازه هاي به دست آمده براي متغير ملاك با نوعي خطا همراه است.
به عنوان مثال، ممكن است نمره هاي حاصل از اجراي يك آزمون به عنوان متغير ملاك مورد استفاده قرار گيرد كه روايي ملاكي آن آزمون كاملا مشخص نيست.
به عنوان يك مثال ديگر، در بررسي روايي يك آزمون استعداد شغلي، درجه بندي مهارت هاي شغلي آزمودني ها توسط سرپرستان به عنوان متغير ملاك به كار بسته شود و نمره هاي مقياس درجه بندي تحت تاثير خطاهاي درجه بندي مثلا خطاي هاله اي قرار گيرد.
بنابراين آزموني كه روايي ملاكي آن بر اساس ملاكي كه خود فاقد روايي و اعتبار كافي است به دست آمده است، نمي تواند به عنوان يك آزمون معتبر و روا مورد استفاده قرار گيرد.
عوامل موثر بر روايي ملاكي: حجم نمونه
گاهي ممكن است روايي بر مبناي يك گروه نمونه كوچك برآورد شده باشد. همبستگي محاسبه شده در مورد يك نمونه كوچك نمي تواند به اندازه همبستگي حاصل از اجراي آزمون در مورد يك نمونه بزرگ تر معتبر باشد. اين امر به ويژه در مورد همبستگي چند متغيري بيشتر صادق است. هر چه حجم نمونه كوچك تر باشد، احتمال به دست آوردن عمبستگي بزرگ تري كه صرفا بر اساس عامل تصادف به دست آمده است، بيشتر است.
عوامل موثر بر روايي ملاكي: معرف بودن گروه نمونه
در بررسي ضريب روايي آزمون ها بايد به اين نكته توجه داشت كه آيا گروهي كه روايي ملاكي بر مبناي خصايص آن گروه برآورد شده است، معرف جامعه اي كه اكنون مي خواهيم آزمون را براي پيش بيني رفتار افراد جامعه به كار ببريم هست يا خير.
به عنوان مثال، اگر ضرريب روايي يك آزمون هوش در مورد كودكان ساكن تهران به دست آمده باشد، احتمال اين كه ضريب در مورد كودكان ساير استان هاي كشور صدق كند، كم است. آزمون تدوين شده براي پيش بيني رفتاردانش آموزان دختر و يا دانش آموزاني كه زبان مادري آنان فارسي است، ممكن است براي پيش بيني رفتار دانش آموزان پسر و يا دانش آموزاني كه زبان مادري آنان فارسي است فاقد روايي ملاكي باشد.
روايي وابسته به سازه
تا پيش از 1950 دانشمندان علوم اجتماعي تنها به روايي محتوا و روايي ملاكي توجه نداشتند. در سال هاي نيمه دهه 1950 پژوهشگران به اين نتيجه رسيدند كه براي بيشتر خصايص اجتماعي و رواني ملاك(بيروني) روشني وجود ندارد.
براي مثال، ساختن آزموني براي اندازه گيري هوش دشوار بود، زيرا كسي به طور قطع نمي دانست بگويد هوش چيست. روايي ملاكي مستلزم آن است كه ملاك مشخصي براي هوش وجود داشته باشد تا آزموني كه براي اندازه گيري هوش ساخته مي شود با آن مقايسه شود. مساله اين است كه ملاك مشخصي براي هوش وجود ندارد. هوش يك سازه فرضي است كه نمي توان يك ملاك قطعي و كاملا مشخص براي آن پيدا كرد.
روايي وابسته به سازه
در حال حاضر، ما اغلب مي خواهيم خصايصي مانند هوش، كنجكاوي، سلامت رواني و مانند اين ها را اندازه بگيريم. همه اين ها سازه هايي هستند كه نمي توان آن ها را تعريف كرد و ملاك هاي مشخصي براي مقايسه نتايج آزمون ها با اين ملاك ها در دست نيست. اين ها مسايل عمده اي هستند كه روان شناسان اغلب با آن ها درگيرند.
روايي سازه با انجام رشته اي از فعاليت هاي كه پژوهشگر از طريف آن ها به طور همزمان سازه هايي را تعريف و ابزارهايي براي اندازه گيري آن ها مي سازد، به دست مي آيد. روايي سازه مستلزم جمع آوري شواهدي است تا بر اساس آن ها معناي آزمون روشن شود. هر بار كه زابطه اي به دست مي ايد، يك معناي اضافي براي آزمون پيدا مي شود. پس از يك رشته مطالعات، معناي آزمون به تدريج شكل مي گيرد. استقرار روايي سازه براي ازمون يك فرايند مداوم است، و به فرايند ساختن نظريه هاي پيچيده علمي بر اساس مجموعه شواهد علمي شباهت دارد. شواهد قطعي روايي سازه هر گز بر اساس مشاهدات منحصر به فرد به دست نمي آيد.
روايي وابسته به سازه: شواهد همگرا و واگرا
كمپيل و فيسك(1959) براي تهيه آزمون هايي كه روايي سازه دارند اصولي را مطرح كرده اند كه در اين جا مورد بحث قرار مي گيرد. آن ها دو نوع شواهد را كه براي با معنا كردن آزمون امري اساسي است، مورد توجه قرار داده اند كه عبارتند از شواهد همگرا(convergent) و شواهد واگرا(discriminant). به نظر آنان براي اين كه آزمون داراي روايي سازه باشد، لازم است هر اندازه كه امكان دارد شواهدي در مورد روايي همگرا و روايي افتراقي فراهم شود
روايي وابسته به سازه: شواهد همگرا
شواهد روايي همگراي آزمون از طريق همبستگي نمره هاي آن با نمره هاي ديگر آزمون هايي كه همان سازه را اندازه مي گيرند جمع آوري مي شود. اين دسته شواهد نشان مي دهند كه آزمون مورد نظر با ساير آزمون هايي كه همان سازه را اندازه مي گيرند «همگرا» است.
شواهد همگرا براي روايي سازه از بسياري جهات شبيه روايي ملاكي است. زيرا در هر دو مورد نمره هاي آزمون با نمره هاي آزمون هاي ديگر همبسته مي شوند. اما، در مورد شواهد همگرا به عنوان ملاك روايي سازه براي تعريف آن چه كه اندازه گيري مي شود، ملاكي وجود ندارد.
روايي ملاكي براي موقعيت هايي كه مي خواهيم عملكرد افراد را در يك متغير خاص- مانند موفقيت در دانشگاه- پيش بيني كنيم مناسب است. در اين جا تكليف كاملا مشخص است، و آن چه كه لازم است انجام شود اين است كه سوال هايي ساخته شوند كه ملاك مورد نظر را به خوبي پيش بيني كنند. در ورايي ملاكي كه كاملا تعريف شده باشند وجود ندارد، از اين رو معناي آزمون بر اساس متغرهايي كه آزمون با آن ها همبسته است روشن مي شود.
روايي وابسته به سازه: شواهد همگرا
براي روشن شدن روايي همگرا به مطالعه اي كه توسط كاپلان، بوش و بري(1976) براي اندازه گيري سازه سلامتي انجام داده اند اشاره مي شود. سلامتي سازه پيچيده اي است كه ابعاد مختلف دارد. به سبب اين پيچيدگي، ملاك منحصز به فردي وجود ندارد كه اندازه سلامتي با آن سنجيده مي شود. بنابراين پژوهشگران ناگزير شدند شواهد همگراي اين سازه كه آن ها را شاخص سلامتي ناميدند بررسي كنند.
شواهد همگرا با يكي از اين دو روش به دست مي آيد.
روش اول آن است كه نشان داده شود آزمون همان خصيصه اي را اندازه مي گيرد كه آزمون هاي مشابه ديگر اندازه مي گيرند.
روش دوم بدين ترتيب است كه روابط خاصي به دست مي آيد كه نشان دهد آزمون خصيصه مورد نظر را به روشني اندازه گيري مي كند.
مطالعه در باره شاخص سلامتي، اين هر دو دسته شواهد را شامل بود.
روايي وابسته به سازه: شواهد همگرا
پژوهشگران براي نشان دادن معناي شاخص سلامتي پيوسته از خود سوال مي كردند «اگر واقعا سلامتي را اندازه مي گيريم، چه نوع روابطي را بايد بين شاخص سلامتي و ساير اندازه ها انتظار داشته باشيم؟».
ساده ترين رابطه در اين مورد، رابطه بين نمره هاي شاخص سلامتي و درجه بندي سلامتي آزمودني ها توسط خود آن هاست. بررسي نشان داد كه بين نمره هاي شاخص سلامتي و درجه بندي سلامتي آزمودنيه ا توسط خودشان رابطه قوي وجود دارد. اما بايد دانست شواهد روايي همگرا بسيار فراتر از رابطه اي است كه بدين ترتيب به دست مي آيد، زيرا روش خود- درجه بندي روش چندان پايايي نيست.
روايي وابسته به سازه: شواهد همگرا
در روايي سازه هيچ ملاك منحصر به فردي نمي تواند به عنوان ملاك سازه به كار رود. بنابراين، رباي نشان دادن ساير روابط، مطالعات ديگري انجام شد. به عنوان مثال، معلوم شد كسلني كه از شاخص سلامتي نمره كمتري ميگيرند، معمولا در باره علايم بيماري آشكار و مزمن خود بيشتر گزارش مي دهند. علاوه بر آن پژوهشگران چنين فرض كردند كه وضع سلامتي افراد با سن آن ها رابطه دارد و لذا مشاهده كردند كه بين اين دو متغير رابطه موجود است. افراد مسن تر، از مقياس شاخص سلامتي نمره هاي كمتري گرفتند.
روايي وابسته به سازه: شواهد همگرا
پژوهشگران مذكور هم چنين اين فرضيه را مطرح كردند كه «اگر شاخص سلامتي واقعا وضع سلامتي افراد را اندازه مي گيرد، بايد بين نمره هاي اين شاخص و تعداد موارد مراجعه آزمودني ها به پزشك رابطه وجود داشته باشد». در بررسي هاي پژوهشگران اين رابطه نيز به اثبات رسيد، و بدين ترتيب شاهد ديگري از روايي همگرا به دست آمد.
هم چنين اين فرضيه را مطرح كردند كه «ميانگين نمره هاي افراد معلول بايد به گونه معني داري پايين تر از ميانگين نمره هاي افراد سالم باشد.» و اين فرضيه نيز به عنوان يكي ديگر از شواهد روايي همگرا به اثبات رسيد. در اين تحقيق شواهد ديگير از جمله رابطه بين نمره هاي شاخص سلامتي و برخي از جنبه هاي فيزيولوژيكي افراد مبتلا به بيماري هاي ريوي، ديابت و مانند آن ها مورد بررسي قرار گرفت و تاييد شد.
بدين ترتيب ، در يك رشته از مطالعات، انبوهي از شواهد به دست آمد كه به تدريج معناي آن چه را كه به وسيله شاخص سلامتي اندازه گيري مي شد براي پژوهشگران روشن ساخت. با وجود اين، شواهد همگرايي تمامي شواهد مربوط به روايي سازه را در آزمون هاي رواني در بر نمي گيرد. بنابراين مطالعاتي نيز در باره شواهد افتراقي روايي سازه امري ضروري است.
روايي وابسته به سازه: شواهد افتراقي
براي روان شناس ممكن است اين سوال مطرح شود كه اگر براي اندازه گيري خصيصه اي يك ازمون ساخته شده است، ساختن آزمون هاي ديگري كه همان خصيصه را اندازه گيري مي كند چه ضرورتي دارد؟
به عنوان مثال، اگر شخص سلامتي همان خصيصه اي را مي سنجد كه مي توان با مقياس خود- سنجي( يا خود درجه بندي)، مقياس سنجش تعداد علايم بيماري، و يا تعداد دفعات مراجعه به پزشك بررسي كرد، ساختن مقياس شاخص سلامتي چه لزومي دارد؟
پاسخ اين سوال آن است كه آزمون چيزي را اندازه مي گيرد كه با خصايصي كه به وسيله آزمون ها اندازه گيري مي شود تفاوت دارد. اثبات يگانگي(uniqueness) آزمون را روايي افتراقي يا روايي واگرا مي نامند.
بعضي از روان شناسان اظهار مي دارند كه تنها يك نوع روايي وجود دارد و آن روايي سازه است و ساير انواع روايي زير طبقه هايي از روايي سازه به شمار مي روند.
روايي وابسته به سازه: شواهد افتراقي
به طور كلي برخي از منابع مهمي كه شواهد روايي بر اساس مطالعه آن ها جمع آوري مي شود به شرح زير است:
1- قضاوت متخصصان در باره ميزان ارتباط محتواي آزمون با سازه مورد اندازه گيري
2- تحليل همساني دروني آزمون. هماهنگي دروني آزمون نشانگر يگانگي آزمون و احتمالا بيانگر آن است كه آزمون سازه واحدي را اندازه مي گيرد.
3- مطالعه تفاوت بين ميانگين نمره هاي گروه هاي مختلف. به عنوان مثال، اگر در يك آزمون هوش ميانگين نمره هاي كودكان 6 ساله بيش از ميانگين نمره هاي كودكان 5 ساله و كمتر از ميانگين نمره هاي كودكان 7 ساله باشد، اين تفاوت نشانگر سازه هوش است كه با افزايش سن رشد مي كند. هم چنين در يك آزمون سنجش اضطراب بايد ميانگين نمره هاي بيماران اضطرابي يالاتر از ميانگين نمره هاي افراد سالم باشد.
روايي وابسته به سازه: شواهد افتراقي
4- همبستگي بين آزمون با ساير متغيرها يا آزمون هايي كه انتظار مي رود همان خصيصه را اندازه بگيرند و تحليل عاملي همبستگي هاي متقابل.
5- مورد پرسش قرار دادن آزمودني ها يا درجه بندي كنندگان در باره پاسخ هايشان نسبت به آزمون يا مقياس درجه بندي براي روشن كردن فرايندهاي خاصي كه به پاسخ هاي آن ها منتهي شده است.
6- بررسي عدم همبستگي آزمون با ساير متغيرهايي كه با سازه مورد نظر ارتباطي ندارند. به عنوان مثال، در آزمون MMPI ، بايد بين مقياس Ma (هيپوماني) و مقياسD (افسردگي) همبستگي منفي و ناچيز مشاهده شود، كه شاخصي از روايي واگراي اين دو مقياس است.
رابطه بين اعتبار و روايي
كوشش براي تعريف و برآورد روايي آزمون فاقد اعتبار تلاشي بيهوده است. به طور نظري مي توان گفت كه همبستگي آزمون با خودش بايد بزرگ تر از همبستگي آن با هر متغير ديگر باشد. بالاترين ضريب همبستگي بين دو متغير برابر ريشه دوم حاصل ضرب اعتبار آن هاست. كه با رابطه زير نشان داده مي شود:
عناصر رابطه بالا عبارتند از:
= حداكثر ضريب همبستگي بين دو متغير
= ضريب اعتبار ازمون اول
= ضريب اعتبار آزمون دوم
رابطه بين اعتبار و روايي
چون معمولا انتظار نمي رود كه ضرايب روايي خيلي بالا باشند، اين امكان وجود دارد كه همبستگي متوسط بين نمره هاي واقعي دو آزمون به علت پايين بودن ضرايب اعتبار آن ها از دست برود. در برآورد روايي ملاكي آزمون هر اندازه كه ضرايب اعتبار آزمون پيش بين و ازمون ملاك بالاتر باشد، احتمال افزايش ضريب روايي ملاكي دو آزمون بيشتر است و بالعكس.
نرم يا هنجار: مفهوم نرم
نرم يا هنجار عبارت است از متوسط عملكرد گروه نمونه اي از آزمودني ها كه به روش تصادفي از يك جامعه تعريف شده انتخاب مي شود.
نرم آزمون هاي استاندارد شده بر اساس توزيع نمره هاي خام گروه نمونه اي از آزمودني ها به دست مي آيد. ميانگين و نقطه 50 درصدي اين توزيع، نمونه هايي از متوسط عملكرد گروه و به عبارت ديگر نرم يا هنجار گروه است.
در آزمون هاي گروه مرجع، نرم يا هنجار مقياس محاسبه شده اي است كه نمره خام آزمودني با آن سنجيده مي شود تا عملكرد وي نسبت به متوسط عملكرد گروه مورد ارزشيابي قرار گيرد.
نرم يا هنجار: مفهوم نرم
براي استاندارد يا ميزان كردن يك آزمون، آن را بر اساس يك دستورالعمل استاندارد شده و تحت شرايط يكسان در باره يك گروه نمونه تصادفي انتخاب شده از جامعه اي كه آزمون در مورد آن استاندارد مي شود اجرا مي كنند. هدف عمده فرايند استاندارد كردن آزمون تعيين توزيع نمره هاي خام گروه معياريابي(گروه نرم) است. سپس نمره هاي به دست آمده به گونه اي از نمره هاي اشتقاقي(derived score)، مانند نمره هاي معادل سني، نمره هاي معادل كلاسي، رتبه هاي درصدي و يا نمره هاي تراز شده تبديل مي شوند.
نرم يا هنجار: مفهوم نرم
در راهنماي اجراي بيشتر آزمون هاي استاندارد شده، جداول نرم وجود دارد كه با استفاده از آن ها نمره هاي خام آزمودني ها را مي توان به نمره هاي اشتقاقي تبديل و آن ها را تفسير كرد.
بدين ترتيب، نرم يك چهارچوب داوري است كه نمره خام آزمودني بر اساس آن تفسير و در باره وي قضاوت مي شود. مقايسه نمره خام آزمودني با جدول نرم به روان شناس امكان مي دهد كه موقعيت آزمودني را نسبت به توزيع نمره هاي خام ساير افراد گروه سني، كلاسي و يا جنسي او تعيين كند.
نرم يا هنجار: انتخاب گروه نرم
براي اين كه تفسير نمره خام آزمون به درستي انجام گيرد، نرم يا هنجار آزمون بايد با شرايط افرادي كه آزمون در مورد آنان اجرا مي شود همخواني داشته باشد. هنگامي كه نمره خام آزمودني بر اساس جدول نرم تفسير مي شود، بايد ماهيت افراد گروه نرم(سن، جنسيت، زبان مادري، گروه قومي، منطقه جغرافيايي، خصايص فرهنگي، سطح اجتماعي- اقتصادي و غيره) همواره مورد نوجه روان شناس باشد.
نرم يا هنجار: انتخاب گروه نرم
هنگام ميزان كردن آزمون به منظور تهيه نرم، ابتدا بايد جامعه اي كه قرار است آزمون در باره افراد آن جامعه(جامعه هدف) ميزان شود، به ئقت تعريف گردد. سپس گروه نمونه اي كه معرف اين جامعه باشد، به روش تصادفي از افراد جامعه به عنوان نمونه معياريابي انتخاب شود.
روش نمونه گيري براي انتخاب گروه نرم، ممكن است از ساده ترين روش نمونه گيري(تصادفي ساده) تا پيچيده ترين روش (نمونه گيري طبقه اي و خوشه اي) استفاده شود.
بديهي است نمونه اي كه با روش نمونه گيري طبقه اي انتخاب مي شود، به دليل اين كه ار هر طبقه فرعي افراد جامعه(جنس، سن، زبان مادري و ...) نمونه هايي در گروه نرم فرار مي گيرند، بهتر از نمونه اي كه از روش تصادفي ساده انتخاب مي شود، معرف جامعه هدف خواهد بود.
نرم يا هنجار: نرم هاي ملي، منطقه اي و محلي
اگر جامعه هدف، به صورت كليه افراد يك كشور كه در يك يا چند صفت مشتركند تعريف شود و افراد گروه نرم از اين جامعه انتخاب گردد، نرمي كه بدين ترتيب به دست مي آيد نرم ملي يا كشوري ناميده مي شود.
بريا انتخاب افراد گروه نرم ملي به سبب گسترده و ناهمگوني جامعه ناگزير بايد از روش نمونه گيري خوشه اي و طبقه اي استفاده شود. در جوامع گسترده و ناهمگون لازم است اولا حجم نمونه انتخاب شده نسبتا زياد باشد، ثانيا طوري نمونه گيري شود كه از همه گروه هاي مختلف جامعه نمونه هايي در گروه نرم قرار گيرند.
نرم يا هنجار: نرم هاي ملي، منطقه اي و محلي
اگر جامعه هدف به صورت كليه افراد يك استان يا منطقه اي از يك كشور كه شامل چند استان همجوار است و در يك صفت مشتركند تعريف شود و افراد گروه نمونه از اين جامعه انتخاب گردد، جداول نرم به دست آمده از نمره هاي خام آزمودني ها، نرم منطقه اي خواهد بود. به عنوان مثال، در مراحل ميزان كردن يك آزمون هوش براي كودكان ايراني ممكن است كشور را بر اساس خصوصيات اقليمي، زبان و گويش و ساير ويژگي هاي مشترك به چند زير جامعه تقسيم و از هر زير جامعه نمونه اي انتخاب و نرم هاي متفاوتي تدوين شود.
هر گاه گروه نرم از افراد يك شهر، يك بخش، قسمتي از يك شهر و يا حتي دانش آموزان يك مدرسه انتخاب شود، جدول نرمي كه بدين ترتيب بر اساس نمره هاي خام افراد گروه نرم ساخته مي شود، نرم محلي خواهد بود.
نرم يا هنجار: نرم هاي سني و كلاسي
نرم هاي سني و نرم هاي كلاسي از جمله نرم هايي هستند كه مصرف كنندگان آزمون ها با آن ها آشنايي دارند. نرم سني(نرم معادل سن تقويمي) نمره مياني يك آزمون است كه افراد گروه سني معيني نمره هاي برابر آن گرفته اند. نرم هاي سني بر حسب سال و ماه و با فاصله هاي يك ماه تدوين مي شوند. به عنوان مثال، نرم سني براي كودكان 5 ساله به صورت زير طبقه بندي مي شود كه در آن ها اعداد سمت چپ، نماينده سال و اعداد سمت راست نماينده ماه هستند.: 0 – 5 سال، 1 – 5 سال و...
نرم هاي كلاسي در كشور هايي كه سال تحصيلي 10 ماه است، بر حسب پايه و ماه هاي سال تحصيلي با فاصله يك ماه به صورت زير طبقه بندي مي شوند كه در آن ها اعداد سمت چپ سطح يا پايه تحصيلي و اعداد سمت راست ماه هاي سال تحصيلي را نشان مي دهند.
1 – 4 سال، 2 – 4سال، 3 – 4 سال و....
نرم يا هنجار: نرم هاي سني و كلاسي
مثلا، طبقه 1-4، به معناي عملكرد دانش آموزان كلاس چهارم در ماه اول يال تحصيلي است. در نظام آموزشي ايران براي تهيه نرم كلاسي، چون سال تحصيلي 9 ماه است، بنابراين طبقه هاي معادل كلاسي در هر پايه تحصيلي شامل 9 طبقه خواهد بود. طبقه بندي نرم كلاسي به فاصله يك ماه بر اين فرضيه استوار است كه با گذشت ماه هاي سال تحصيلي، به تدريج و با آهنگ يكسان سطح پيشرفت دانش آموزان افزايش مي يابد.
نرم سني براي سنجش خصايصي به كار مي رود كه با افزايش سن رابطه دارند مانند هوش و بعضي از استعدادهاي شناختي ديگر.
نرم كلاسي براي سنجش پيشرفت تحصيلي كه با افزايش پايه تحصيلي افزايش مي يابد به كار مي رود.
نرم يا هنجار: نرم هاي سني و كلاسي
يكي از محدوديت هاي نرم سني و كلاسي اين است كه واحدهاي مقياس اين دو نرم در طول مقياس برابر نيستند.
به عنوان مثال، تفاوت افزايش سطح پيشرفت تحصيلي در فاصله بين معادل هاي كلاسي 2-5 تا 4-5 با افزايش سطح پيشرفت تحصيلي در فاصله هاي معادل هاي كلاسي 2-8 تا4-8 برابر نيست.
در عمل واحد هاي نرم سني و معادل كلاسي با افزايش سن و پايه تحصيلي مرتبا كوچك نر مي شوند. بنابراين به سبب ناهمساني در سرعت افزايش توانايي هاي مورد اندازه گيري و در نتيجه نابرابري واحدها، متخصصان اندازه گيري آموزشي و تربيتي ترجيح مي دهند از نرم هايي استفاده كنند كه واحدهاي آن ها در طول مقياس همساني بيشتري داشته باشد.
نرم يا هنجار: نرم هاي سني و كلاسي
اما به سبب سهولت استفاده از نرم هاي سني و كلاسي، اين نرم ها در سطح مدارس ابتدايي، كه فرض همساني نسبي آهنگ رشد بيشتر صادق باشاست، هم چنان مورد استفاده قرار مي گيرند. با وجود اين، در اين سطح نيز لازم است براي هر يك از گروه هاي سني و يا معادل هاي كلاسي، نمره هاي تراز شده يا رتبه هاي درصدي تهيه شود.
نرم يا هنجار: نرم هاي سن هنجاري
modal age norms
معمولا همه دانش آموزان يك پايه تحصيلي كه نرم كلاسي براي آن تهيه مي شود سن برابر ندارند و دامنه تغيير سن آن ها اغلب زياد است. با وجود اين، نمره هاي دانش آموزان خيلي جوان تر و افراد مسن تر از افراد متوسط كلاس در محاسبه نرم وارد مي شود. براي تهيه شاخص دقيق تر از متوسط نمره دانش آموزان يك پايه تحصيلي، نمره هاي افراد خيلي جوان تر و افراد خيلي مسن تر حذف و نرم بر اتساس نمره هاي دانش آموزاني كه سن آن ها با سطح پايه تحصيلي شان متناسب است محاسبه مي شود. نرم كلاسي كه بدين ترتيب به دست مي آيد، نرم سني هنجاري ناميده مي شود.
نرم يا هنجار: نرم هاي سن عقلي
mental age norms
اصطلاح سن عقلي توسط آلفرد بينه، روان شناس فرانسوي مطرح شد و امروزه در بيشتر آزمون هاي هوشي مورد استفاده قرار مي گيرد. سن عقلي يك آزمودني معين برابر سن تقويمي آن دسته از كودكان همسال او در يك گروه هنجاريابي است كه نمره مياني آن ها با نمره آزمودني مورد نظر برابر باشد. معمولا در مدارس عقب مانده هاي ذهني، طبقه بندي دانش آموزان براي هدف هاي آموزشي بر مبناي سن عقلي انجام مي گيرد.
نرم يا هنجار: خارج قسمت ها
quotients
يكي از روش هاي قديمي تهيه نرمة كه اكنون تقريبا كنار گذاشته شده است، تبديل نرم سني آزمودني به نوعي خارج قسمت بود كه از تقسيم نمره سني يا سن عقلي بر سن تقويمي و ضرب آن در عدد 100به دست آمد. بدين ترتيب خارج قسمت هوش در فرم قديمي آزمون استنفورد بينه از رابطه زير محاسبه مي شد. (MA/CA) 100 = IQ
در اين رابطه، IQ خارج قسمت هوش يا هوشبهر، MA سن عقلي و CA سن تقويمي آزمودني است.
هم چنين خارج قسمت تحصيلي(educational quotient) در بعضي از آزمون هاي پيش رفت تحصيلي از راه تقسيم نرم سني بر سن تقويمي به دست مي آمد.
نرم يا هنجار: نرم هاي درصدي
نرم هاي درصدي بر اساس نمره هاي خام آزمودني هاي گرو نرم كه با فاصله طبقه اي معين طبقه بندي مي شوند، به دست مي آيد. هر نمره خام را نمره درصدي(percentile) و درصد افراد نرم را كه زير نمره معيني قرار ميگيرد رتبه درصدي(percentile rank) مي نامند. به عنوان مثال، در جدول شماره 1 نمره 72 در طبقه دوم از بالا نمره درصدي است كه رتبه درصدي آن 97 است، يعني نمره 97 درصد افراد زير آن قرار دارد.
نرم يا هنجار: نرم هاي درصدي
براي روشن شدن روش محاسبه نرم درصدي به جدول شماره 8-1 توجه كنيد.
در اولين ستون سمت چپ جدول، فاصله نمره ها با فاصله طبقه اي 5، در ستون دوم اعداد مياني هر طبقه و بالاخره تراكمي زير اعداد مياني طبقه ها را نشان مي دهد.
براي محاسبه فراواني تراكمي زير عدد مياني هر طبقه كافي است نصف فراواني مطلق آن طبقه را با مجموع فراواني هاي مطلق طبقه هاي پايين تر جمع كنيم.
به عنوان مثال، فراواني تراكمي زير عدد مياني براي پايين ترين طبقه برابر 0/5(0/5=يك دوم + 0 ) و براي دومين طبقه از پايين برابر 7/5 است.(7/5=13:2 + 1). رتبه درصدي هر طبقه از حاصل ضرب فراواني تراكمر زير عدد مياني آن طبقه در N : 100 به دست مي ايد. (N مجموع فراواني هاي مطلق و يا تعداد افراد گروه نرم است).
نرم يا هنجار: نرم هاي درصدي
نرم يا هنجار: نرم هاي درصدي
به سبب سهولت محاسبه و تفسير رتبه هاي درصدي، در جدول هاي نرم بيشتر آزمون هاي استاندارد شده از اين نرم استفاده مي شود. در اين جدول ها، نرم هاي درصدي براي گروه هاي سني، پايه هاي تحصيلي، شغلي، جنسيت و ساير گروه هاي محاسبه مي شود. نا همساني واحدهاي رتبه ها در نرم هاي درصدي نيز مانند نرم هاي سني و كلاسي از جمله محدوديت هاي نرم درصدي است.
چنان كه از نمودار 8-1 ملاحظه مي شود، واحد هاي رتبه هاي درصدي از نوع مقياس رتبه اي هستند نه مقياس فاصله اي. با توجه به نمودار شماره 8-1 ملاحظه مي شود كه فاصله بين رتبه هاي درصدي 5 و 0 يا 90 و 95 بزرگ تر از فاصله بين رتبه هاي 40 و 45 يا 60 و 65 است.
با وجودي كه تفاوت عددي هر دسته از اين دو رتبه با يكديگر برابرند، اما اندازه رتبه هاي درصدي برابر نيستند. زيرا به سبب خاصيت زنگوله اي بودن نمره ها، هر چه از دو حد انتهايي توزيع به حد وسط نزديك تر مي شويم اندازه رتبه ها مرتبا كاهش مي يابند.
نرم يا هنجار: نرم هاي درصدي
به سبب انباشته شدن رتبه هاي درصدي در وسط و پراكندگي آن ها در دو انتهاي توزيع، تفسير تغييرات و تفاوت هاي نرم هاي درصدي دشوار مي شود.
به عنوان مثال، تفاوت پيشرفت تحصيلي دو دانش آموز كه يكي رتبه 5 درصدي و ديگري رتبه 10 درصدي گرفته است، با تفاوت دو دانش آموز ديگر كه رتبه درصدي يكي 40 و رتبه درصدي ديگري 45 است، برابر نيست. تفاوت بين رتبه هاي 5 و 10 درصدي بيشتر از تفاوت بين رتبه هاي 40 و 45 درصدي است، زيرا واحدهاي مقياس در مورد دو رتبه اول بزرگ تر از واحد هاي رتبه ها ي دوم است.
با وجود اين، چنان چه استفاده كنندگان از اين نرم، به نابرابري واحدهاي رتبه ها در طول مقياس توجه كنند و براي تفاوت رتبه هاي انتهايي در مقايسه با رتبه هاي مياني، وزن بيشتري قايل باشند، مي توانند آن ها را به گونه اي روشن تر تفسير كنند.
نرم يا هنجار: نرم نمره هاي تراز شده
(standard score norms)
بر خلاف نرم درصدي، نمره هاي تراز شده از نوع مقياس فاصله اي هستند كه اندازه واحدهاي آن ها در سرتاسر مقياس برابرند. نمره هاي تراز شده، نمره هاي تبديل شده اي هستند كه مي توان آن ها را بر حسب ميانگين و انحراف معيار دلخواه محاسبه كرد. نمره هاي تراز شده انئاع مختلف دارند كه از آن جمله اند نمره هاي z، نمره هاي Z، نمره هاي CEEB(Colledge Entrance Examination Bord، نمره هاي امتحانات ورودي دانشگاه ها)، نمره هاي AGCT(Army General Classification Test، آزمون هاي ارتشي آلفا و بتا)، هوشبهر انحرافي(deviation IQ)، نمره هاي نه بخشي(stanine scores)، و نمره هاي T .
در عمل همه اين نرم ها بر مبناي نمره z محاسبه مي شوند.
نرم يا هنجار: نرم نمره هاي تراز شده
به نمودار ص 240 كتاب شريفي(1377) مراجعه نماييد.
نرم يا هنجار: نمره z
نمره z از رابطه زير به دست مي آيد.
در اين رابطه، X نمره خام، ميانگين نمره هاي خام افراد گروه نرم و s انحراف معيار نمره هاي خام افراد گروه نرم است. با تبديل نمره هاي خام به نمره z توزيع جديدي به دست مي آيد كه ميانگين آن برابر با صفر و انحراف معيار آن برابر يك است. شكل منحني توزيع جديد با شكل توزيع نمره هاي خام آن يكسان است. در جدول شماره 8-1 نمره هاي z اعداد مياني طبقه ها در ستون 6 نشان داده شده است. به عنوان مثال، نمره z براي اعداد ميانياولين طبقه از بالا 2/59 است. در نمودار 8-1 نيز در خط پايه منحني نمره z از 4- تا 4+ نشان داده شده است.
نرم يا هنجار: نمره هاي Z
چون نمره z داراي ارقام اعشاري و نيمي از اين نمره ها در توزيع نرمال منفي است، بنابراين كاركردن با اين نمره ها تا اندازه اي دشوار است. اگر نمره z را در عدد ثابت 10 ضرب و حاصل ضرب را با عدد ثابت 50 جمع كنيم نمره هاي Z به دست مي آيد كه ميانگين آن ها 50 و انحراف معيار آن ها 10 است. شكل توزيع نمره هاي Z نيز مانند توزيع نمره هاي اصلي افراد گروه نرم با آن يكسان است. نمره هاي Z در ستون 7 جدول 8 – 1 نشان داده شده اند.
نرم يا هنجار: نمره هاي تراز شده بهنجار(نرمال) شده
همه نرم هاي نمره هاي تراز شده كه در بالا به آن ها اشاره شد، تبديل خطي ساده نمره هاي خام هستند. ميانگين و انحراف معيار توزيع نمره هاي تبديل شده با ميانگين و انحراف معيار نمره هاي خام تفاوت مي كند، اما شكل توزيع در هر دو مورد يكسان است. تبديل گروهي از نمره هاي خام به نمره هاي تراز به هنجار شده با محاسبه رتبه هاي درصدي نمره هاي خام شروع مي ود. سپس با استفاده از جدول سطح منحني نرمال، نمره هاي z هر يك از رتبه هاي درصدي به دست مي آيد.
فرض كنيد مي خواهيم عدد مياني(ستون 2) جدول شماره 8-1 را به نمره هاي تراز به هنجار شده تبديل كنيم. چون رتبه هاي درصدي اين نمره ها محاسبه شده است(ستون 5)، لذا كافي است اين رتبه ها را با تقسيم كردن بر صد به نسبت تبديل كرده و سپس z مربوط به آن را از جدول سطح منحني نرمال پيدا كنيم. نمره هاي z كه بدين طريق به دست مي آيند با علامتzn يعني نمره هاي z نرمال شده نشان داده مي شوند. آن گاه ساير نمره هاي تراز شده مانند نمره هاي CEEB، T،AGCT، و IQ را بر مبناي zn محاسبه مي كنيم.
نرم يا هنجار: نمره هاي CEEB
نمره هاي CEEB كه معمولا در آزمون هاي ورودي دانشگاه ها به كار مي روند، نمره هايي هستند كه ميانگين آن ها 500 و انحراف معيار آن ها 100 است. بنابراين براي تبديل نمره هاي z به نمره هاي CEEB كافي است از رابطه زير استفاده شود.
500 + 100 * zn = CEEB
شكل توزيع نمره هاي CEEB نيز مانند شكل توزيع نمره هاي خام افراد گروه نرم است. نمره هاي CEEB محاسبه شده براي نمره هاي مياني طبقه ها در ستون 8 جدول 8-1 نشان داده شده است.
نرم يا هنجار: نمره هاي T
نمره هاي T نمره هاي تراز شده اي هستند كه ميانگين آن ها 50 و انحراف معيار آن ها 10 است. براي محاسبه نمره هاي T كافي است اندازه هاي zn را در 10 ضرب كرده حاصل را با 50 جمع كنيم يعني:
50 +10* zn = T
نرم يا هنجار: نمره هاي AGCT
اين نمره ها كه براي نخستين بار براي نمره هاي آزمون ارتشي طبقه بندي كلي محاسبه شد، نمره هاي تراز شده اي هستند كه با ميانگين 100 و انحراف معيار 20 محاسبه مي شوند. توزيع اين نمره ها كه همان شكل توزيع نمره هاي اوليه را دارد، در ستون 9 جدول 8-1 براي اعداد مياني هر طبقه محاسبه شده است. روش محاسبه بر اساس فرمول زير انجام مي گيرد.
100 + 20 * zn = AGCT
نرم يا هنجار: نمره هاي انحرافي آزمون وكسلر
هوشبهر انحرافي آزمون وكسلر داراي ميانگين 100 و انحراف معيار 15 است كه از رابطه زير به دست مي آيد.
100 + 15 * zn = IQ (وكسلر)
در نمره هاي تراز شده آزمون هاي فرعي اين تست ميانگين برابر 10 و انحراف معيار برابر 3 فرض شده است.
نرم يا هنجار: نمره هاي هوشبهر انحرافي آزمون استنفورد- بينه
در اين آزمون ميانگين برابر 100 و انحراف معيار برابر 16 فرض شده است. بنابراين محاسبه هوشبهر انحرافي در آزمون استنفورد بينه از رابطه زير به دست مي آيد.
100 + 16 * = zn IQ
نرم يا هنجار: نمره هاي نه بخشي
نمره هاي zn را مي توان به هر نمره تراز شده و با هر ميانگين و انحراف معياري تبديل كرد. يكي از نرم هاي معروف كه براي درجه بندي افراد در نيروي هوايي آمريكا و بعدها براي مقاصد آموزشي و ارزشيابي مورد استفاده فراوان پيدا كرد، نمره هاي نه بخشي(standard nine=stanine) است.
مقياس نه بخشي، كه مقياس نمره هاي تراز شده با ميانگين 5 و انحراف معيار تقريبا 2 است، اين مقياس داراي نه بخش است كه با اعداد از 1 تا 9 نشان داده مي شوند. چنان كه در نمودار(ص 240) ملاحظه مي شود، در يك توزيع نرمال درصد معيني از افراد در هر يك از 9 بخش مقياس قرار مي گيرند. پنجمين بخش اين مقياس كه ميانگين آن است به فاصله يك چهارم انحراف معيار از دو طرف ميانگين توزيع قرار مي گيرد و ساير بخش ها نيز هر يك ، يك دوم انحراف معيار از توزيع نرمال را شامل مي شوند.
نرم يا هنجار: نمره هاي نه بخشي
بايد دانست كه نمره هاي 9 بخشيع نمره هاي تراز شده واقعي نيستند، زيرا بخش اول و نهم آن بي انتهاست. در نمودرا 8-1 ملاحظه مي شود كه اندازه هاي واحدها در بخش هاي 2 تا 8 يكسانند، اما بخش يك و بخش 9 گسترده تر از ساير بخش ها است.
يكي از مزيت هاي نمره هاي نه بخشي اين است كه به جاي نقاط معين، دامنه هايي از نمره ها را نشان مي دهند. اين امر موجب مي شود كه اجرا كنندگان آزمون ها تصور نكنند كه نمره هاي مشاهده شده آزمودني ها، نمره هايي دقيق و يا اندازه هاي تغيير ناپذير خصايص رواني است.
چنان كه در بحث از خطاي معيار اندازه گيري و برآورد حدود نمره هاي واقعي آزمودني ملاحظه شد، نتيجه آزمون را نبايد يك نمره منحصر به فرد و تغيير ناپذير دانست. بلكه همواره نمره واقعي آزمودني در سطح اطمينان معين در فاصله بين دو نمره قرار مي گيرد. نمره هاي نه بخشي، نتايج آزمون ها را بر اساس اين اطمينان مشخص مي كنند.
نرم يا هنجار: تاريخ تنظيم جداول نرم
يكي از مسايل عمده در مورد جداول نرم آن است كه اين جداول معمولا سال ها قبل تهيه و تنظيم شده اند. چون تهيه و تنظيم جداول نرم مستلزم صرف اعتبار و هزينه هاي زيادي است، بنابراين امكان تجديد نظر در آن ها محدود است.
تهيه كنندگان آزمون ها معمولا هر 10 سال يك بار در جداول نرم تجديد نظر مي كنند. از آن جا كه تجارب و محيط زندگي كودكان و دانش آموزان و هم چنين برنامه ها و روش هاي آموزشي در حال تغيير است، نرم هايي كه در سال هاي گذشته تهيه شده اند در زمان حال فاقد ارزش و اعتبار كافي هستند.
به عنوان مثال چون روش تدريس رياضيات امروزه لااقل در مدارس ابتدايي بهتر از سال هايپيش است، اگر دانش آموزي در يك آزمون رياضي كه نرم آن 10 سال پيش تهيه شده است رتبه 50 درصدي را به دست آوردة چنان چه با نرم امروز سنجيده شود، ممكن است رتبه درصدي وي با اين نرم كاملا متفاوت باشد. به همين دليل است كه اجرا كنندگان آزمون ها بايد تاريخ تنظيم جداول نرم آزمون را مورد توجه قرار داده و در تعبير و تفسير نتايج آزمون ها محدوديت هاي مربوط به آن را مد نظر قرار دهند.
نيمرخ هاي رواني
نيم رخ رواني آزمودني به صورت نموداري ارائه مي گردد كه در آن نتايج اجراي چند آزمون بر اساس نرم يا مقياس واحد نشان داده مي شود. در نيم رخ رواني، نمره هاي آزمودني در آزمون هاي مختلف و يا در آزمون هاي فرعي يك آزمون، ممكن است به صورت رتبه هاي درصدي، نمره هاي تراز شده و يا هوشبهر انحرافي نشان داده شود.
نيم رخ رواني را مي توان به صورت نمودار ستوني يا نمودار چند ضلعي ترسيم كرد. براي رسم نيم رخ رواني، ابتدا دو محور عمود بر هم رسم مي كنيم و سپس روي محور افقي خصايص مورد اندازه گيري و روي محور عمودي نمره تراز شده يا نمره هنجاري خصايص اندازه گيري شده مشخص مي شود.
نيمرخ هاي رواني
براي تهيه نيم رخ ستوني كافي است نام صفت مورد اندازه گيري رسم گردد. در نيم رخ هاي چند ضلعي نيز به همين ترتيب عمل مي شود. در نيم رخ هاي رواني، براي سهولت تفسير نتايج آزمون ها، خطي كه حد متوسط يا بهنجار را نشان مي دهد كشيده مي شود تا نمره هاي بالاتر و يا پايين تر از حد بهنجار مشخص شوند.
براي روشن تر شدن مطالب بالا به دو نمونه از نيم رخ هاي رواني مربوط به دو آزمودني همراه با تفسير نتايج آن در كتاب(شريفي، ص 245 و 246 ) توجه كنيد.
ساختن آزمون هاي استانداد شده
ساختن و استاندارد كردن آزمون، عملي پيچيده و فني بوده و مستلزم دانش و مهارت سطح بالاي تخصص در همه زمينه هاي روان سنجي است. سازندگان آزمون علاوه بر داشتن صلاحيت علمي و تخصصي و دانش نظري در روان سنجي، بايد در مورد انواع آزمون هاي مختلف نيز از تجارب عملي كافي برخوردار باشند
اقدام به ساختن و استاندارد كردن آزمون در هر زمينه منوط به برقراري شرايط زير است:
1) آزمون هاي معتبر و استاندارد شده كافي در آن زمينه موجود نباشد.
2) سازندگان آزمون علاوه بر داشتن نيروي تخصصي در زمينه هاي مختلف روان سنجي از منابع مالي كافي برخوردار باشند.
3) آزموني كه ساخته مي شود در مورد تعداد زيادي از آزمودني ها و براي مدت نسبتا طولاني براي هدف هاي تحصيلي و شغلي، تشخيص هاي باليني و ساير مقاصد آموزشي و درماني به كار بسته شود.
مراحل ساختن آزمون هاي استانداد شده
1) تعيين هدف هاي تهيه آزمون:
سازندگان آزمون ابتدا بايد هدف هاي آزموني كه قصد ساختن آن را دارند تعيين كنند. براي اين كار لازم است به پرسش هاي زير توجه شود.
1- آزمون براي كدام يك از مقاصد روان سنجي مانند ارزشيابي آموزشي، راهنمايي تحصيلي، راهنمايي شغلي، گزينش و يا هدف هاي تشخيصي ساخته مي شود؟
2- آزمون مورد نظر براي سنجش كدام يك از خصايص آزمودني ها مانند پيشرفت تحصيلي، هوش، استعداد و يا صفات شخصيت آنان به كار خواهد رفت؟
اگر آزمون پيشرفت تحصيلي است، براي سنجش پيشرفت تحصيلي آزمودني ها در چه سطحي و در مورد كدام درس ساخته مي شود؟
مراحل ساختن آزمون هاي استانداد شده
1) تعيين هدف هاي تهيه آزمون(ادامه):
4- اگر آزمون از نوع آزمون هوش، استعداد و يا صفات شخصيتي است، بر اساس كدام يك از نظريه هاي روان شناسي و روان سنجي ساخنه مي شود؟
5- محتواي آزمون مورد نظر چيست و نوع سوال هاي آن كلامي است يا غير كلامي،چند گزينه اي است و يا كوته پاسخ؟
6- آزمون در مورد كدام گروه سني و يا كلاسي اجرا مي شود و براي چه نوع نرمي تهيه خواهد شد؛ نرم محلي، نرم منطقه اي و يا نرم ملي؟
مراحل ساختن آزمون هاي استانداد شده
2- تهيه محتواي فرم تجربي آزمون
پاسخ هاي دقيق سازندگان آزمون به پرسش هاي بالا و انجام بررسي هاي لازم در اين مورد با آن ها امكان مي دهد كه نسبت به تدوين محتواي آزمون به صورت فرم تجربي اقدام كنند. نظرخواهي از متخصصان موضوعي . روان شناسيان و مرور آزمون هاي مشابه كه در ساير كشورها به كار بسته شده است، سازندگان آزمون را در تدوين محتواي آزمون كمك خواهد كرد.
مراحل ساختن آزمون هاي استانداد شده
2- تهيه محتواي فرم تجربي آزمون(ادامه)
پس از تعيين هدف ها و محتواي آزمون، پرسش هاي آزمون نوشته مي شوند. تعداد پرسش هايي كه در فرم اوليه آزمون گنجانده مي شود، بايد بيش از تعداد پرسش هايي باشد كه در فرم نهايي يا فرم اصلي آزمون وجود خواهد داشت. علت اين امر آن است كه در مراحل تجديد نظر در پرسش ها و يا تجزيه و تحليل آن ها احتمالا برخي پرش ها حذف خوهند شد. پرسش هاي تدوين شده بايد توسط تعدادي از متخصصان موضوعي، روان شناسان و متخصصان روان سنجي مورد بررسي قرار گيرند و تجديد نظر لازم در آن ها به عمل آيد. پس از تجديد نظر در پرسش ها، فرم تجربي آزمون تنظيم و به تعداد مورد نياز چاپ و تكثير مي شود.
مراحل ساختن آزمون هاي استانداد شده
2- تهيه محتواي فرم تجربي آزمون(ادامه)
در بعضي موارد سازندگان آزمون تصميم مي گيرند آزموني را كه در ساير كشورها استاندارد شده است در ايران هنجاريابي كنند. براي اين كار نخست بايد آزمون مورد نظر به فارسي ترجمه شود. ترجمه آزمون بايد به گونه اي باشد كه اگر مترجم ديگري كه به زبان فارسي و زبان اصلي آزمون مورد بحث تسلط كامل دارد، آن را به زبان اصلي(زبان خارجي) ترجمه كند، محتواي اين ترجمه با محتواي آزمون به زبان اصلي كاملا يكسان باشد.
پس از ترجمه آزمون، سازندگان آزمون ممكن است بعضي از موارد آن را كه با فرهنگ ايراني كاملا بيگانه است حذف و به جاي آن ها ماده هاي ديگري كه از نظر اصول روان سنجي همان فرايند ذهني را اندازه مي گيرند قرار دهند. پس از انجام اين كار و پس از بررسي و تجديد نظرهاي لازم، فرم تجربي آزمون تدوين و به تعداد مورد نياز چاپ و تكثير مي شود.
مراحل ساختن آزمون هاي استانداد شده
3 ) اجراي فرم تجربي آزمون
از جامعه هدف يعني جامعه اي كه سرانجام آزمون استاندارد شده براي سنجش خصايص آنان به كار بسته خواهد شد، با روش نمونه گيري تصادفي، يك گروه نمون انتخاب و آزمون در مورد افراد اين گروه اجرا مي شود. سپس پاسخ خاي آزمودني ها به هر يك از پرسش ها بر اساس دستوالعمل آزمون تصحيح و نمره گذاري مي شود.
مراحل ساختن آزمون هاي استانداد شده
4) تجزيه و تحليل سوال هاي آزمون
سوال هاي فرم تجربي آزمون كه در مورد گروه نمونه تصادفي از آزمودني ها اجرا شده است، مورد تجزيه و تحليل قرار مي گيرند(فصل 5). شخص هاي آماري هر يك از سوال ها، ضرايب همبستگي آن ها با يكديگر، با نمره كل آزمون و با ساير ملاك هاي خارجي محاسبه مي شود. سوال هاي نامناسب يعني سوال هايي كه فاقد ضريب تشخيص و اعتبار لازم بوده اند حذف مي شوند. سپس ضريب اعتبار (همساني دروني) آزمون پس از حذف سوال هاي نامناسب با استفاده از روش دو نيمه كردن، روش كودر- ريچادسون و يا ساير روش هاي مناسب برآورد مي شود. آن گاه ميانگين، انحراف معيار، خطاي معيار اندازه گيري و ساير شاخص هاي آماري آزمون محاسبه مي گردد.
مراحل ساختن آزمون هاي استانداد شده
4) تجزيه و تحليل سوال هاي آزمون(ادامه)
در صورتي كه ازمون داراي پرسش هاي چند گزينه اي است، اين پرسش ها نيز مورد تجزيه و تحليل قرار مي گيرند و در صورت لزومة تجديد نظر در گزينه ها و يا سوال هاي آزمون به عمل مي آيد.
پس از انجام مراحل بالا، سوال هاي آزمون بر حسب سطح دشواري محاسبه شده به ترتيب از آسان به مشكل تنظيم و فزم جديد آزمون تدوين مي شود.
مراحل ساختن آزمون هاي استانداد شده
5) وارسي تجزيه و تحليل سوال هاي آزمون
ازموني كه بر اساس تجزيه و تحليل مرحله قبل تدوين شده است مجددا در مورد يك گروه نمونه از آزمودني ها كه به روش تصادفي از جامعه هدف انتخاب شده است اجرا مي شود. نتايج حاصل از اين آزمايش بر اساس آن چه در مرحله قبلي گفته شد، مورد تجزيه و تحليل قرار مي گيرد. با مقايسه نتايج حاصل از دو آزمايش مي توان اعتبار يافته هاي مرحله قبل را از روي نتايج اين مرحله مورد بررسي و قضاوت قرار داد. در هر حال، در اين مرحله نيز پس از حذف سوال هاي نامناسب، شاخص هاي آماري آزمون محاسبه و سوال هاي آن از آسان به مشكل تنظيم و فرم نهايي آزمون تدوين مي شود.
مراحل ساختن آزمون هاي استانداد شده
6) تهيه و تنظيم جدول هاي نرم آزمون
چنان چه گروه نمونه اي كه آزمون فرم تجربي در مرحله دوم در باره آن اجرا شده است به قدر كافيزياد و در سطح اطمينان لازم آماري معرف جامعه هدف بوده و هيچ يك از سوال هاي آزمون در اين مرحله حذف يا تعديل نشده باشد، مي توان از روي نمره هاي خام آزمودني ها جدول هاي نرم آزمون را تنظيم كرد. اما در هر حال بهتر است آزمون فرم نهايي بار ديگر در مورد گروه نمونه بزرگ آماري از افراد جامعه هدف اجرا شود.
پس از اجراي مجدد و نمره گذاري نتايج آزمون، مي توان با استفاده از روش هاي مطرح شده در بخش اول اين فصل، پس از محاسبه ميانگين و انحراف معيار نمره هاي خام، به تهيه و تنظيم جدول هاي نرم آزمون اقدام كرد.
مراحل ساختن آزمون هاي استانداد شده
6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون
گر چه در مراحل استاندارد كردن آزمون برخي از شواهد روايي آزمون مانند روايي محتوايي، همبستگي هر يك از سوال ها با كل نمره ازمون(همساني دروني) به عنوان يكي از شواهد روايي سازه، و در پاره اي موارد همبستگي سوال ها با برخي ملاك هاي خارجي مورد مطالعه قرار مي گيرند، اما انجام مطالعه مستمر براي برآورد روايي ملاكي و روايي سازه آزمون تدوين شده امري اساسي است.
مراحل ساختن آزمون هاي استانداد شده
6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون(ادامه)
براي اين منظور، سازندگان آزمون بايد با در نظر گرفتن ملاك هاي خارجي و با مطالعه در مورد شواهد سازه آزمون، در آزمون هاي تدوين شده مي توان همبستگي نمره هاي آن ها را با نمره هاي آزمون هاي مشابهي كه قبلا در مورد جامعه هدف استاندارد شده است به عنوان يكي از شاخص هاي روايي آزمون مورد بررسي قرار داد. همبستگي بين نمره هاي آزمون هوش و استعداد و نمره هاي پيشرفت تحصيلي آزمودني ها نيز شاخص ديگري از روايي آزمون را به دست خواهد داد.
مراحل ساختن آزمون هاي استانداد شده
6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون(ادامه)
در آزمون هاي علايق تحصيلي، تفاوت ميانگين نمره هاي تحصيلي افراد موفق با افراد ناموفق در رشته هاي تحصيلي و هم چنين همبستگي بين نمره هاي آزمون علايق تحصيلي و درجه بندي علايق توسط معلمان مي تواند به عنوان شاهدي از روايي سازه و يا روايي ملاكي آزمون تلقي شود.
در آزمون هاي شخصيت، همبستگي بين نمره هاي آزمون و صفات شخصيتي ازمودني ها كه توسط دوستان شان درجه بندي مي شود و هم چنين توافق بين نمره هاي آزمون هاي تشخيصي و باليني مانند آزمون سنجش اضطراب با درجه بندي اضطراب آزمودني ها توسط روان پزشكان و روان شناسان باليني شواهدي از روايي سازه آزمون هاي مذكور را به دست مي دهند.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
ا) راهنماي اجراي آزمون
راهنماي اجراي آزمون بايد استاندازد شده و كاملا روشن باشد. در راهنما بايد نوع كاري كه آزمودني بايد انجام دهد و چگونگي انجام آن به گونه روشن شرح داده شود. لازم است كه براي آشنا شدن آزمودني ها با نوع سوال ها و چگونگي پاسخ دادن به آن ها، چند سوال نمونه در راهنماي آزمون مطرح و طرز پاسخ دادن به آن ها توضيح داده شود.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
ا) راهنماي اجراي آزمون
در آزمون هايي كه به پاسخ هاي غلط نمره منفي داده مي شود، بايد اين نكته در راهنماي اجراي آزمون ذكر گردد. اگر قرار است به پاسخ هاي غلط نمره منفي داده نشود، اين نكته نيز بايد در راهنماي اجراي آزمون به گونه صريح مطرح شده و به آزمودني ها گفته شود كه اگر پاسخ سوالي را نمي دانند، از بين پاسخ هاي پيش نهادي يا گزينه هاي آزمون بهترين پاسخي را كه به نظرشان درست است انتخاب كنند. هم چنين در راهنماي آزمون بايد زمان استاندارد شده براي پاسخ دادن به پرسش هاي آزمون به آزمودني ها گفته شود. زمان استاندارد براي هر آزمون عبارت از ميانگين زمان صرف شده توسط 75 درصد آزمودني ها براي كامل كردن آزمون در مراحل اجراي فرم تجربي است.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
2- نمره گذاري آزمون
آزمون بايد به گونه اي طراحي شود كه نمره گذاري پاسخ هاي آزمودني ها به آساني و به سرعت امكان پذير باشد و تا جايي كه امكان دارد نمره گذاري پاسخ ها به صورت عيني انجام گيرد. اعتبار و پايايي آزمون نبايد به سبب ناپايايي نمره گذاري آن كاهش يابد. وزن يا نمره اي كه براي هر سوال در نظر گرفته مي شود بهتر است با سطح دشواري سوال متناسب باشد. بدين معنا كه براي سوال هاي آسان وزن كمتر و براي س.ال هاي دشوار وزن بيشتري منظور شود.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
3- تعداد سوال هاي آزمون
هر چه تعداد سوال هاي آزمون بيشتر باشد، اعتبار و پايايي آن بيشتر است. آزمون يا بايد داراي تعداد زيادي سوال باشد كه به هر يك از آن ها نمره جداگانه اي داده مي شود و يا شامل تعداد كمتري از تكاليف باشد كه به هر يك از آن ها نمره خاصي تعلق مي گيرد. گنجاندن يك سوال محاسبه اي كه يافتن پاسخ درست آن مستلزم صرف وقت زياد است سوال نامناسبي به شمار مي رود. زيرا آزمودني در ازاي چندين دقيقه وقتي كه براي پاسخ دادن به آن صرف مي كند، نمره اي برابر پاسخ درست سوال هايي مي گيرد كه با صرف چند ثانيه پاسخ درست آن ها را پيدا مي كند.بنابراين بايد زمان و سطح مهارت لازم براي پاسخ دادن به همه سوال ها در هر بخش آزمون تقريبا يكسان باشد يا نمره هر سوال با سطح دشواري و زمان لازم براي يافتن پاسخ درست آن متناسب باشد.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
4- سطح دشواري سوال هاي آزمون
آزمون بايد با پرسش هايي شروع شود كه همه آزمودني ها به راحتي بتوانند به آن ها پاسخ درست بدهند. سوال هاي اول آزمون نبايد دشوار بوده و موجب دلسردي آزمودني ها شوند. بهد از چند سوال خيلي آسان كه در ابتداي آزمون گنجانده مي شوند، سطح دشواري سوال هاي بعدي آزمون بايد به تدريج افزايش يابد. بايد بين عملكرد آزمودني ها در هر يك از سوال ها و عملكرد آنان در كل آزمون همبستگي مثبت موجود باشد. اگر همبستگي بين يك سوال با نمره كل آزمون منفي و يا خيلي كم باشد، احتمالا بدان معناست كه آن سوال خصيصه اي را اندازه مي گيرد كه با ان چه كه به وسيله كل آزمون سنجيده مي شود تفاوت دارد.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
5- سوال هاي چند گزينه اي
پرسش هاي چندگزينه اي به سبب آن كه نمره گذاري آن ها به آساني و به سرعت امكان پذير است، در اغلب آزمون هاي مداد- كاغذي مورد استفاده قرار مي گيرند. اما، نمره هاي حاصل از اين نوع سوال ها ممكن است تا حدي با نمره واقعي آزمودني ها متفاوت باشد. به همين دليل بعضي از سازندگان آزمون، پرسش هايي را ترجيح مي دهند كه آزمودني پاسخ ها را از خزانه حافظه خود بازيابي و آن ها را توليد كند.
در آزمون هايي كه با پرسش هاي چند گزينه اي ساخته مي شوند، مي توان در ازاي هر پاسخ غلط،..... نمره (n تعداد گزينه هاي پاسخ هاست) از نمره هاي پاسخ هاي درست آزمودني كم كرد و بدين ترتيب عامل حدس و گمان را از بين برد. البته اين در صورتي است كه براي هر پاسخ درست يك نمره در نظر گرفته شده باشد.
در آزمون هايي كه با سوال هاي 5 يا 6 گزينه اي ساخته مي شوند، احتمال يافتن تصادفي پاسخ هاي درست كمتر از سوال هاي 3 يا 4 گزينه اي است. چنان چه در مراحل استاندارد كردن آزمون از فرمول تصحيح براي حذف عامل حدس و گمان استفاده شده است، در اجرا و نمره گذاري آزمون فرم نهايي نيز بايد نمره گذاري آزمون بر همين اساس انجام گيرد.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
6- دامنه تغيير سوال ها
آزمون ها معمولا با سوال هاي متعدد و گوناگون ساخته مي شوند. سازندگان آزمون بايد به اين نكته توجه داشته باشند كه در هر يك از بخش هاي آزمون سوال هايي را بگنجانند كه همه آن ها توانايي واحدي را بسنجند. بنابراين، در هر يك از بخش هاي فرعي آن از گنجاندن سوال هاي نامربوط به آن بخش بايد اجتناب كنند.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
7- محتواي آزمون
در آزمون هايي كه براي اندازه گيري استعداد و توانايي شغلي به كار مي روند، بايد پرسش هايي در محتواي آزمون گنجانيده شوند كه به طور مستقيم يا غير مستقيم در موفقيت آن شغل موثر باشند. بنابراين از طرح سوال هايي كه به محفوظات، دانش نظري محض و يا آموخته هاي كلاسيك مربوطند و اغلب افراد آن ها را فراموش مي كنند بايد اجتناب شود.
نكات اساسي در تهيه و استاندارد كردن آزمون ها
8- توجه به كل محتوا
در ساختن آزمون هاي پيشرفت تحصيلي، سازندگان آزمون اغلب بخش هايي از محتواي درس را مورد توجه قرار مي دهند كه ساختن پرسش هاي آزمون در مورد آن ها آسان تر است. بدين ترتيب، ممكن است بعضي از جنبه هاي موضوع مورد اندازه گيري ناديده گرفته شود. اما بايد دانست روايي آزمون بسته به اين است كه محتواي آزمون تمامي جنبه هاي مهم زمينه مورد اندازه گيري را شامل شود. آزموني كه سوال هاي آن همه زمينه هاي مهم را شامل نباشد فاقد روايي محتوايي است.
روش اجراي آزمون هاي ميزان شده:آزمون هاي گروهي
اجراي بعضي آزمون هاي گروهي با گذراندن يك دوره كوتاه كارآموزي ميسر است. اما اجراي بعضي ديگر از آزمون ها به مهارت و تجربه طولاني تري نياز دارد. معمولا اجراي آزمون هاي گروهي در مقايسه با آزمون هاي فردي با كارآموزي كوتاه تري امكان پذير است.
آزنايش كننده بايد آزمايش را چنان ماهرانه و طبق دستورالعمل استاندارد شده برگزار كند كه به هر يك از افراد آزمايش شونده امكان داده شود تا حداكثر استعداد و توانايي خود را در پاسخ دادن به پرسش هاي آزمون نشان دهد.
آزمايش كننده بايد قبلا در مورد محتواي آزمون، دستورالعمل اجراي آن و ساير شرايطي كه بايد رعايت شود آگاهي لازم را به دست آورد.
اجراي آزمون هاي گروهي
نكات مهم در اجراي آزمون هاي استاندارد شده :
شرايطي مشابه با شرايط تهيه و استاندازد آزمون براي كليه آزمايش شوندگان فراهم شود.
رعايت كامل دستورالعمل آزمون
كوشش در برقراري رابطه مطلوب بين آزمايش شونده و آزمايش كننده به منظور جلب اعتماد آنان(به ويژه در آزمون هاي فردي)
گذرانده دوره هاي كارآموزي عملي(علاوه بر فراگيري دانش هاي نظري)
اجراي آزمون هاي گروهي
1- شرايط اجراي آزمون:
1- ايجاد شرايط فيزيكي مناسب در جلسه آزمايش(از نظر نور، تهويه، درجه گرما، راحت بودن محل نشستن) نارسايي در هر يك از عواما مذكور موجب مي شود كه ميزان كارآيي آزمايش شوندگان كاهش يابد. اين مساله در مورد آزمون هاي سرعت بيش از آزمون هاي قدرت اثر نامطلوب بر جاي مي گذارد.
2- آزمون شوندگان به راحتي صداي مجري آزمون و راهنمايي هاي او را به راحتي بشنوند.
3- اتاق آزمايش از هر نوع عامل حواس پرتي مانند سر و صدا، تابلوهاي نقاشي، زنگ تلفن، آمد و رفت افراد و صحبت هاي مراقبان جلسه و هر عامل ديگري كه باعث عدم تمركز فكري و كاهش دقت آزمايش شوتدگان مي شود، به دور باشد.
اجراي آزمون هاي گروهي
1- شرايط اجراي آزمون:
4- وضعيت روحي و جسمي آزمون شونده نتيجه آزمون را تحت تاثير قرار مي دهد. بنابراين، اجراي آزمون در مورد افراد خسته، عصباني، بي ميل، بيمارو غيره موجب مي شود كه نتيجه آزمون بيانگر نمونه اي از رفتارهاي واقعي آنان نباشد.
5- نحوه برخورد و رفتار آزمايش كننده و حالات روحي او( مانند خستگي،عصبانيت صداي نارسا) مي تواند تا حد زيادي نتيجه آزمون را تحت تاثير قرار دهد.
اجراي آزمون هاي گروهي
- اقدامات قبل از توزيع دفترچه آزمون:
1- پيش بيني لوازم مورد نياز
2- معرفي مجري و بيان هدف كلي از اجراي آزمون به زبان ساده
3- اجتناب از به كار بردن اصطلاحات فني
اجراي آزمون هاي گروهي
3- اداره جلسه آزمايش و اجراي آزمون(وظيفه مجري)
ايجاد شرايط استاندارد و همراه با احساس اطمينان براي انجام آزمايش برابر دستورالعمل آزمون
در نظر گرفتن يك دستيار براي هر 15 تا 20 نفر آزمايش شونده
در مورد آزمايش شوندگان خردسال مانند دانش آموزان دبستان يا دوره راهنمايي توضيحات لازم مطابق دستورالعمل آزمون توسط مجري داده مي شود.
اگر آزمايش شونده اي از مجري آزمون سوالي بپرسد، او نبايد در دادن پاسخ مطلبي اضافه بر آن چه كه در دستورالعمل ذكر شده است، بيان كند.
اگر به پاسخ هاي غلط نمره منفي تعلق نمي گيرد، اين امر به آزمون شوندگان اعلام شود تا اگر پاسخ سوالي را نمي دانند، بهترين پاسخ را حدس بزنند.
كنترل وقت آغاز و پايان جلسه با كرونومتر
اجراي آزمون هاي گروهي
نمره گذاري پاسخ نامه ها
قبل از تصحيح و نمره گذاري پاسخ نامه ها با توجه به سه نكته زير مورد بررسي قرار گيرند.
1- نبايد بيش از يك گزينه به عنوان پاسخ صحيح انتخاب شده باشد.
2- براي مواردي كه پاسخ در محل مناسب قرار داده نشده، تصميم گيري شود.
3- در صورتي كه آزمودني از روي اشتباه، پاسخ سوال بعدي را در محل سوالي قبلي كه جواب ان را نمي دانسته علامت زده باشد، پاسخ نامه وي با در نظر گرفته اشتباه در جابه جايي پاسخ ها تصحيح شود.
بعد از تعيين تعداد پاسخ هاي صحيح، غلط و سفيد نمره خام آزمودني با احتساب يا بدون احتساب نمره منفي محاسبه شود.
اجراي آزمون هاي فردي
نكات اساسي در اجراي آزمون هاي انفرادي
1- رعايت كامل دستورالعمل آزمون
2- ايجاد شرايط فيزيكي مطلوب در اتاق آزمايش
3- ايجاد همدلي با آزمودني
4- تكرار پرسش ها( به جز آزمون هاي حافظه)
5- مرتب كردن وسايل آزمايش
6- توجه به حالات بدني آزمودني
7- كاوش پاسخ هاي مبهم آزمودني
8- مشاهده رفتار آزمودني
9- ارزشيابي پاسخ ها (با توجه به ملاك هاي دستورالعمل)
10- جلب اعتماد آزمودني خردسال
11- آزمايش آزمودني هاي داراي عقب ماندگي ذهني در بخش هاي زماني كوتاه
عوامل موثر در نتايج آزمون ها
1- تاثير آزمايش كننده ( جنسيت، سن، نژاد، سطح مهارت، برخورد اجتماعي، پايگاه حرفه اي، و پايگاه اجتماعي- اقتصادي).
پژوهش نشان داده است كه رابطه گرم يا سرد آزمايش كننده در نتايج آزمايش گروهي از آزمودني ها تفاوت معني دار ايجاد كرده است.
2- تجارب پيش از آزمايش آزمودني ها.
مك كارتي گروهي از دانش آموزان دبستان را دو بار با تست آدمك مورد آزمايش قرار داد. بار اول آزمودني ها پيش از آمدن به جلسه آزمايش، انشايي در باره «بهترين تجارب زندگي خود» و بار دوم انشايي در باره «بدترين تجارب زندگي خود» نوشته بودند. در آزمايش دوم هوشبهر كودكان 4 الي 5 نمره كمتر از آزمايش اول بود. اين تفاوت ممكن است به سبب آشفتگي هاي هيجاني كودكان در مرتبه دوم باشد كه در آن انشايي در باره «بدترين تجارب زندگي خود» نوشته بودند.
عوامل موثر در نتايج آزمون ها
3- تمرين ها و آمادگي قبلي آزمودني ها:
آشنايي آزمودني ها با نمونه هايي از آزمون ها و تمرين هاي قبلي آنان مي تواند تا حدي در نتيجه آزمايش اثر بگذارد. دليل اين تمرين، يادآوري برخي از پاسخ ها، يادگيري راه حل ها و كسب بينش نسبت به مواد آزمايش بوده است.
هم چنين كساني كه در پاشخ دادن به آزمو ن ها ي مختلف تجربه زيادي دارند، اين تجربه آمادگي بيشتري براي پاسخ دادن به آزمون ها در آنان بخ وجود مي آورد. علت اين امر غالبا اعتماد به نفسي است كه اين افراد نسبت به انجام آزمون ها پيدا مي كنن كه ضمن كاهش اضطراب آنان موقعيت بهتري را بريشان فراهم مي كند.
ملاحظات اخلاقي و اجتماعي در كاربرد آزمون ها
مراحل ساختن آزمون هاي استانداد شده
1
مراحل ساختن آزمون هاي استانداد شده
مراحل ساختن آزمون هاي استانداد شده
مقياس سازي
الن- پيمايش در علوم اجتماعي
مقياس هاي درجه بندي رفتار
اقدام پژوهي
اجراي آزمون ها
تبديل و معادل سازي نمره هاي آزمون
بيان نتايج آزمون
اماري
نيمرخ
گنجي- پيام نور
نرم يا هنجار: نرم هاي سني و كلاسي
نرم يا هنجار: نرم هاي سني و كلاسي
نرم يا هنجار: نرم هاي سني و كلاسي
نرم يا هنجار: نرم هاي سني و كلاسي
نرم يا هنجار: نرم هاي سني و كلاسي
نرم يا هنجار: نرم هاي سني و كلاسي