نظريه سوال- پاسخ(item- response theory) رابطه اين دو شاخص با شاخص هاي P و D ، كاملا آشكار است، اما بايد دانست بر اساس منحني سوال- پاسخ، يك تصوير جامع از رابطه تابعي بين درصد پاسخ هاي درست و نمره هاي ملاك به دست مي ايد كه از داده هاي حاصل از تجزيه و تحليل ساده سوال ها فراتر مي رود. در رويكردهاي جديد تجزيه و تحليل سوال هاي ازمون، منحني هاي سوال- پاسخ بر اساس درصد پاسخ هاي درست ازمودني ها در ارتباط با برآوردهايي از توانايي آنان كه از تابع رياضياتي خاص به دست مي ايد، ترسيم مي شود. اين رويكردها را كه بر حسب فرض هاي زيربنايي و روش هايي كه براي برآورد متغيرها به كار مي بندند، نظريه صفت مكنون، نظريه منحني ويژه سوال، يا الگوي راش ناميده مي شوند. در اين رويكردها، عملكرد آزمودني ها در سوال هاي ازمون(درصد پاسخ هاي درست) به موقعيت برآورد شده آن ها روي يك پيوستار فرضي صفت مكنون ربط داده مي شود.اصلاح سطح دشواري سوال ها براي حذف عامل حدس و گمان در آزمون هاي چندگزينه اي همواره اين احتمال وجود دارد كه بعضي از آزمودني ها براي يافتن پاسخ هاي درست سوال ها آن ها را حدس بزنند. براي حذف عامل حدس و گمان لازم است سطح دشواري سوال ها اصلاح شود. اصلاح حدس و گمان بر دو فرضيه استوار است: 1) پاسخ غلط به سبب بي اطلاعي آزمودني از موضوع مورد اندازه گيري و گرايش وي به حدس زدن است 2) جاذبه همه گزينه هاي پرسش ها براي ازمودني هاي بي اطلاع از موضوع يكسان است. با قبول اين دو فرضيه مي توان سطح دشواري سوال ها را با استفاده از فرمول  زير براي حذف عامل حدس و گمان اطلاح كرد.اصلاح سطح دشواري سوال ها براي حذف عامل حدس و گمان بعضي از عناصر اين فرمول  كه تا كنون معرفي نشده اند، به شرح زير است: Pc = درصد كساني كه واقعا پاسخ درست سوال را مي دانند HR= تعداد كساني كه فرصت پاسخ دادن به سوال ها را نداشته و آن ها را بدون پاسخ گذاشته اند N = تعداد كل آزمودني ها به عنوان مثال، اگر از يك گروه 300 نفري، 150 نفر به يك سوال 5 گزينه اي پاسخ درست، 120 نفر پاسخ غلط داده و 30 نفر بقيه فرصت پاسخ دادن به آن را نداشته  و ان را بي جواب گذاشته باشند، سطح دشواري اصلاح شده سوال به شرح زير خواهد بود:ويژگي هاي يك آزمون الف: ويژگي هاي اصلي: پايايي روايي نرم يا هنجار حساسيت ب: ويژگي هاي فرعي: سهولت اجرا سهولت نمره گذاري صرفه جويي در وقت صرفه جويي در هزينهنرم يا هنجار: مفهوم نرم نرم يا هنجار عبارت است از متوسط عملكرد گروه نمونه اي از آزمودني ها كه به روش تصادفي از يك جامعه تعريف شده انتخاب مي شود.  نرم آزمون هاي استاندارد شده بر اساس توزيع نمره هاي خام گروه نمونه اي از آزمودني ها به دست مي آيد. ميانگين و نقطه 50 درصدي اين توزيع، نمونه هايي از متوسط عملكرد گروه و به عبارت ديگر نرم يا هنجار گروه است.  در آزمون هاي گروه مرجع، نرم يا هنجار مقياس محاسبه شده اي است كه نمره خام آزمودني با آن سنجيده مي شود تا عملكرد وي نسبت به متوسط عملكرد گروه مورد ارزشيابي قرار گيرد.نرم يا هنجار: مفهوم نرم براي استاندارد يا ميزان كردن يك آزمون، آن را بر اساس يك دستورالعمل استاندارد شده و تحت شرايط يكسان در باره يك گروه نمونه تصادفي انتخاب شده از جامعه اي كه آزمون در مورد آن استاندارد مي شود اجرا مي كنند. هدف عمده فرايند استاندارد كردن آزمون تعيين توزيع نمره هاي خام گروه معياريابي(گروه نرم) است. سپس نمره هاي به دست آمده به گونه اي از نمره هاي اشتقاقي(derived score)، مانند نمره هاي معادل سني، نمره هاي معادل كلاسي، رتبه هاي درصدي و يا نمره هاي تراز شده تبديل مي شوند. نرم يا هنجار: مفهوم نرم در راهنماي اجراي بيشتر آزمون هاي استاندارد شده، جداول نرم وجود دارد كه با استفاده از آن ها نمره هاي خام آزمودني ها را مي توان به نمره هاي اشتقاقي تبديل و آن ها را تفسير كرد. بدين ترتيب، نرم يك چهارچوب داوري است كه نمره خام آزمودني بر اساس آن تفسير و در باره وي قضاوت مي شود. مقايسه نمره خام آزمودني با جدول نرم به روان شناس امكان مي دهد كه موقعيت آزمودني را نسبت به توزيع نمره هاي خام ساير افراد گروه سني، كلاسي و يا جنسي او تعيين كند.نرم يا هنجار: انتخاب گروه نرم براي اين كه تفسير نمره خام آزمون به درستي انجام گيرد، نرم يا هنجار آزمون بايد با شرايط افرادي كه آزمون در مورد آنان اجرا مي شود همخواني داشته باشد. هنگامي كه نمره خام آزمودني بر اساس جدول نرم تفسير مي شود، بايد ماهيت افراد گروه نرم(سن، جنسيت، زبان مادري، گروه قومي، منطقه جغرافيايي، خصايص فرهنگي، سطح اجتماعي- اقتصادي و غيره) همواره مورد نوجه روان شناس باشد.نرم يا هنجار: انتخاب گروه نرم هنگام ميزان كردن آزمون به منظور تهيه نرم، ابتدا بايد جامعه اي كه قرار است آزمون در باره افراد آن جامعه(جامعه هدف) ميزان شود، به ئقت تعريف گردد. سپس گروه نمونه اي كه معرف اين جامعه باشد، به روش تصادفي از افراد جامعه به عنوان نمونه معياريابي انتخاب شود.  روش نمونه گيري براي انتخاب گروه نرم، ممكن است از ساده ترين روش نمونه گيري(تصادفي ساده) تا پيچيده ترين روش (نمونه گيري طبقه اي و خوشه اي) استفاده شود. بديهي است نمونه اي كه با روش نمونه گيري طبقه اي انتخاب مي شود، به دليل اين كه ار هر طبقه فرعي افراد جامعه(جنس، سن، زبان مادري و ...) نمونه هايي در گروه نرم فرار مي گيرند، بهتر از نمونه اي كه از روش تصادفي ساده انتخاب مي شود، معرف جامعه هدف خواهد بود.نرم يا هنجار: نرم هاي ملي، منطقه اي و محلي اگر جامعه هدف، به صورت كليه افراد يك كشور كه در يك يا چند صفت مشتركند تعريف شود و افراد گروه نرم از اين جامعه انتخاب گردد، نرمي كه بدين ترتيب به دست مي آيد نرم ملي يا كشوري ناميده مي شود.  بريا انتخاب افراد گروه نرم ملي به سبب گسترده و ناهمگوني جامعه ناگزير بايد از روش نمونه گيري خوشه اي و طبقه اي استفاده شود. در جوامع گسترده و ناهمگون لازم است اولا حجم نمونه انتخاب شده نسبتا زياد باشد، ثانيا طوري نمونه گيري شود كه از همه گروه هاي مختلف جامعه نمونه هايي در گروه نرم قرار گيرند.نرم يا هنجار: نرم هاي ملي، منطقه اي و محلي اگر جامعه هدف به صورت كليه افراد يك استان يا منطقه اي از يك كشور كه شامل چند استان همجوار است و در يك صفت مشتركند تعريف شود و افراد گروه نمونه از اين جامعه انتخاب گردد، جداول نرم به دست آمده از نمره هاي خام آزمودني ها، نرم منطقه اي خواهد بود. به عنوان مثال، در مراحل ميزان كردن يك آزمون هوش براي كودكان ايراني ممكن است كشور را بر اساس خصوصيات اقليمي، زبان و گويش و ساير ويژگي هاي مشترك به چند زير جامعه تقسيم و از هر زير جامعه نمونه اي انتخاب و نرم هاي متفاوتي تدوين شود. هر گاه گروه نرم از افراد يك شهر، يك بخش، قسمتي از يك شهر و يا حتي دانش آموزان يك مدرسه انتخاب شود، جدول نرمي كه بدين ترتيب بر اساس نمره هاي خام افراد گروه نرم ساخته مي شود، نرم محلي خواهد بود.نرم يا هنجار: نرم هاي سني و كلاسي نرم هاي سني و نرم هاي كلاسي از جمله نرم هايي هستند كه مصرف كنندگان آزمون ها با آن ها آشنايي دارند. نرم سني(نرم معادل سن تقويمي) نمره مياني يك آزمون است كه افراد گروه سني معيني نمره هاي برابر آن گرفته اند. نرم هاي سني بر حسب سال و ماه و با فاصله هاي يك ماه تدوين مي شوند. به عنوان مثال، نرم سني براي كودكان 5 ساله به صورت زير طبقه بندي مي شود كه در آن ها اعداد سمت چپ، نماينده سال و اعداد سمت راست نماينده ماه هستند.: 0 – 5 سال، 1 – 5 سال و... نرم هاي كلاسي در كشور هايي كه سال تحصيلي 10 ماه است، بر حسب پايه و ماه هاي سال تحصيلي با فاصله يك ماه به صورت زير طبقه بندي مي شوند كه در آن ها اعداد سمت چپ سطح يا پايه تحصيلي و اعداد سمت راست ماه هاي سال تحصيلي را نشان مي دهند. 1 – 4 سال، 2 – 4سال، 3 – 4 سال و....نرم يا هنجار: نرم هاي سني و كلاسي مثلا، طبقه 1-4، به معناي عملكرد دانش آموزان كلاس چهارم در ماه اول يال تحصيلي است. در نظام آموزشي ايران براي تهيه نرم كلاسي، چون سال تحصيلي 9 ماه است، بنابراين طبقه هاي معادل كلاسي در هر پايه تحصيلي شامل 9 طبقه خواهد بود. طبقه بندي نرم كلاسي به فاصله يك ماه بر اين فرضيه استوار است كه با گذشت ماه هاي سال تحصيلي، به تدريج و با آهنگ يكسان سطح پيشرفت دانش آموزان افزايش مي يابد. نرم سني براي سنجش خصايصي به كار مي رود كه با افزايش سن رابطه دارند مانند هوش و بعضي از استعدادهاي شناختي ديگر. نرم كلاسي براي سنجش پيشرفت تحصيلي كه با افزايش پايه تحصيلي افزايش مي يابد به كار مي رود.نرم يا هنجار: نرم هاي سني و كلاسي يكي از محدوديت هاي نرم سني و كلاسي اين است كه واحدهاي مقياس اين دو نرم در طول مقياس برابر نيستند. به عنوان مثال، تفاوت افزايش سطح پيشرفت تحصيلي در فاصله بين معادل هاي كلاسي 2-5 تا 4-5 با افزايش سطح پيشرفت تحصيلي در فاصله هاي معادل هاي كلاسي 2-8 تا4-8 برابر نيست. در عمل واحد هاي نرم سني و معادل كلاسي با افزايش سن و پايه تحصيلي مرتبا كوچك نر مي شوند. بنابراين به سبب ناهمساني در سرعت افزايش توانايي هاي مورد اندازه گيري و در نتيجه نابرابري واحدها، متخصصان اندازه گيري آموزشي و تربيتي ترجيح مي دهند از نرم هايي استفاده كنند كه واحدهاي آن ها در طول مقياس همساني بيشتري داشته باشد.نرم يا هنجار: نرم هاي سني و كلاسي اما به سبب سهولت استفاده از نرم هاي سني و كلاسي، اين نرم ها در سطح مدارس ابتدايي، كه فرض همساني نسبي آهنگ رشد بيشتر صادق باشاست، هم چنان مورد استفاده قرار مي گيرند. با وجود اين، در اين سطح نيز لازم است براي هر يك از گروه هاي سني و يا معادل هاي كلاسي، نمره هاي تراز شده يا رتبه هاي درصدي تهيه شود.نرم يا هنجار: نرم هاي سن هنجاريmodal age norms معمولا همه دانش آموزان يك پايه تحصيلي كه نرم كلاسي براي آن تهيه مي شود سن برابر ندارند و دامنه تغيير سن آن ها اغلب زياد است. با وجود اين، نمره هاي دانش آموزان خيلي جوان تر و افراد مسن تر از افراد متوسط كلاس در محاسبه نرم وارد مي شود. براي تهيه شاخص دقيق تر از متوسط نمره دانش آموزان يك پايه تحصيلي، نمره هاي افراد خيلي جوان تر و افراد خيلي مسن تر حذف و نرم بر اتساس نمره هاي دانش آموزاني كه سن آن ها با سطح پايه تحصيلي شان متناسب است محاسبه مي شود. نرم كلاسي كه بدين ترتيب به دست مي آيد، نرم سني هنجاري ناميده مي شود.نرم يا هنجار: نرم هاي سن عقليmental age norms اصطلاح سن عقلي توسط آلفرد بينه، روان شناس فرانسوي مطرح شد و امروزه در بيشتر آزمون هاي هوشي مورد استفاده قرار مي گيرد. سن عقلي يك آزمودني معين برابر سن تقويمي آن دسته از كودكان همسال او در يك گروه هنجاريابي است كه نمره مياني آن ها با نمره آزمودني مورد نظر برابر باشد. معمولا در مدارس عقب مانده هاي ذهني، طبقه بندي دانش آموزان براي هدف هاي آموزشي بر مبناي سن عقلي انجام مي گيرد.نرم يا هنجار: خارج قسمت هاquotients يكي از روش هاي قديمي تهيه نرمة كه اكنون تقريبا كنار گذاشته شده است، تبديل نرم سني آزمودني به نوعي خارج قسمت بود كه از تقسيم نمره سني يا سن عقلي بر سن تقويمي و ضرب آن در عدد 100به دست آمد. بدين ترتيب خارج قسمت هوش در فرم قديمي آزمون استنفورد بينه از رابطه زير محاسبه مي شد.      (MA/CA) 100 = IQ در اين رابطه، IQ خارج قسمت هوش يا هوشبهر، MA سن عقلي و CA سن تقويمي آزمودني است. هم چنين خارج قسمت تحصيلي(educational quotient) در بعضي از آزمون هاي پيش رفت تحصيلي از راه تقسيم نرم سني بر سن تقويمي به دست مي آمد. نرم يا هنجار: نرم هاي درصدي نرم هاي درصدي بر اساس نمره هاي خام آزمودني هاي گرو نرم كه با فاصله طبقه اي معين طبقه بندي مي شوند، به دست مي آيد. هر نمره خام را نمره درصدي(percentile) و درصد افراد نرم را كه زير نمره معيني قرار ميگيرد رتبه درصدي(percentile rank) مي نامند. به عنوان مثال، در جدول شماره 1 نمره 72 در طبقه دوم از بالا نمره درصدي است كه رتبه درصدي آن 97 است، يعني نمره 97 درصد افراد زير آن قرار دارد.نرم يا هنجار: نرم هاي درصدي براي روشن شدن روش محاسبه نرم درصدي به جدول شماره 8-1 توجه كنيد. در اولين ستون سمت چپ جدول، فاصله نمره ها با فاصله طبقه اي 5، در ستون دوم اعداد مياني هر طبقه و بالاخره تراكمي زير اعداد مياني طبقه ها را نشان مي دهد. براي محاسبه فراواني تراكمي زير عدد مياني هر طبقه كافي است نصف فراواني مطلق آن طبقه را با مجموع فراواني هاي مطلق طبقه هاي پايين تر جمع كنيم. به عنوان مثال، فراواني تراكمي زير عدد مياني براي پايين ترين طبقه برابر 0/5(0/5=يك دوم + 0 ) و براي دومين طبقه از پايين برابر 7/5 است.(7/5=13:2 + 1). رتبه درصدي هر طبقه از حاصل ضرب فراواني تراكمر زير عدد مياني آن طبقه در N : 100 به دست مي ايد. (N مجموع فراواني هاي مطلق و يا تعداد افراد گروه نرم است).نرم يا هنجار: نرم هاي درصدينرم يا هنجار: نرم هاي درصدي به سبب سهولت محاسبه و تفسير رتبه هاي درصدي، در جدول هاي نرم بيشتر آزمون هاي استاندارد شده از اين نرم استفاده مي شود. در اين جدول ها، نرم هاي درصدي براي گروه هاي سني، پايه هاي تحصيلي، شغلي، جنسيت و ساير گروه هاي محاسبه مي شود. نا همساني واحدهاي رتبه ها در نرم هاي درصدي نيز مانند نرم هاي سني و كلاسي از جمله محدوديت هاي نرم درصدي است. چنان كه از نمودار 8-1 ملاحظه مي شود، واحد هاي رتبه هاي درصدي از نوع مقياس رتبه اي هستند نه مقياس فاصله اي. با توجه به نمودار شماره 8-1 ملاحظه مي شود كه فاصله بين رتبه هاي درصدي 5 و 0 يا 90 و 95 بزرگ تر از فاصله بين رتبه هاي 40 و 45 يا 60 و 65 است. با وجودي كه تفاوت عددي هر دسته از اين دو رتبه با يكديگر برابرند، اما اندازه رتبه هاي درصدي برابر نيستند. زيرا به سبب خاصيت زنگوله اي بودن نمره ها، هر چه از دو حد انتهايي توزيع به حد وسط نزديك تر مي شويم اندازه رتبه ها مرتبا كاهش مي يابند.نرم يا هنجار: نرم هاي درصدي به سبب انباشته شدن رتبه هاي درصدي در وسط و پراكندگي آن ها در دو انتهاي توزيع، تفسير تغييرات و تفاوت هاي نرم هاي درصدي دشوار مي شود. به عنوان مثال، تفاوت پيشرفت تحصيلي دو دانش آموز كه يكي رتبه 5 درصدي و ديگري رتبه 10 درصدي گرفته است، با تفاوت دو دانش آموز ديگر كه رتبه درصدي يكي 40 و رتبه درصدي ديگري 45 است، برابر نيست. تفاوت بين رتبه هاي 5 و 10 درصدي بيشتر از تفاوت بين رتبه هاي 40 و 45 درصدي است، زيرا واحدهاي مقياس در مورد دو رتبه اول بزرگ تر از واحد هاي رتبه ها ي دوم است.  با وجود اين، چنان چه استفاده كنندگان از اين نرم، به نابرابري واحدهاي رتبه ها در طول مقياس توجه كنند و براي تفاوت رتبه هاي انتهايي در مقايسه با رتبه هاي مياني، وزن بيشتري قايل باشند، مي توانند آن ها را به گونه اي روشن تر تفسير كنند.نرم يا هنجار: نرم نمره هاي تراز شده(standard score norms)بر خلاف نرم درصدي، نمره هاي تراز شده از نوع مقياس فاصله اي هستند كه اندازه واحدهاي آن ها در سرتاسر مقياس برابرند. نمره هاي تراز شده، نمره هاي تبديل شده اي هستند كه مي توان آن ها را بر حسب ميانگين و انحراف معيار دلخواه محاسبه كرد. نمره هاي تراز شده انئاع مختلف دارند كه از آن جمله اند نمره هاي z، نمره هاي Z، نمره هاي CEEB(Colledge Entrance Examination Bord، نمره هاي امتحانات ورودي دانشگاه ها)، نمره هاي AGCT(Army General Classification Test، آزمون هاي ارتشي آلفا و بتا)، هوشبهر انحرافي(deviation  IQ)، نمره هاي نه بخشي(stanine scores)، و نمره هاي T .در عمل همه اين نرم ها بر مبناي نمره z محاسبه مي شوند.هنجارها و نيمرخ هانرم يا هنجار: نرم نمره هاي تراز شده به نمودار ص 240 كتاب شريفي(1377) مراجعه نماييد.نرم يا هنجار: نمره z نمره z از رابطه زير به دست مي آيد. در اين رابطه، X نمره خام،    ميانگين نمره هاي خام افراد گروه نرم و s انحراف معيار نمره هاي خام افراد گروه نرم است. با تبديل نمره هاي خام به نمره z توزيع جديدي به دست مي آيد كه ميانگين آن برابر با صفر و انحراف معيار آن برابر يك است. شكل منحني توزيع جديد با شكل توزيع نمره هاي خام آن يكسان است. در جدول شماره 8-1 نمره هاي z اعداد مياني طبقه ها در ستون 6 نشان داده شده است. به عنوان مثال، نمره z براي اعداد ميانياولين طبقه از بالا 2/59 است. در نمودار 8-1 نيز در خط پايه منحني نمره z از 4- تا 4+ نشان داده شده است.نرم يا هنجار: نمره هاي Z چون نمره z داراي ارقام اعشاري و نيمي از اين نمره ها در توزيع نرمال منفي است، بنابراين كاركردن با اين نمره ها تا اندازه اي دشوار است. اگر نمره z را در عدد ثابت 10 ضرب و حاصل ضرب را با عدد ثابت 50 جمع كنيم نمره هاي Z به دست مي آيد كه ميانگين آن ها 50 و انحراف معيار آن ها 10 است. شكل توزيع نمره هاي Z نيز مانند توزيع نمره هاي اصلي افراد گروه نرم با آن يكسان است. نمره هاي Z در ستون 7 جدول 8 – 1 نشان داده شده اند.نرم يا هنجار: نمره هاي تراز شده بهنجار(نرمال) شده همه نرم هاي نمره هاي تراز شده كه در بالا به آن ها اشاره شد، تبديل خطي ساده نمره هاي خام هستند. ميانگين و انحراف معيار توزيع نمره هاي تبديل شده با ميانگين و انحراف معيار نمره هاي خام تفاوت مي كند، اما شكل توزيع در هر دو مورد يكسان است. تبديل گروهي از نمره هاي خام به نمره هاي تراز به هنجار شده با محاسبه رتبه هاي درصدي نمره هاي خام شروع مي ود. سپس با استفاده از جدول سطح منحني نرمال، نمره هاي z هر يك از رتبه هاي درصدي به دست مي آيد.  فرض كنيد مي خواهيم عدد مياني(ستون 2) جدول شماره 8-1 را به نمره هاي تراز به هنجار شده تبديل كنيم. چون رتبه هاي درصدي اين نمره ها محاسبه شده است(ستون 5)، لذا كافي است اين رتبه ها را با تقسيم كردن بر صد به نسبت تبديل كرده و سپس z مربوط به آن را از جدول سطح منحني نرمال پيدا كنيم. نمره هاي z كه بدين طريق به دست مي آيند با علامتzn يعني نمره هاي z نرمال شده نشان داده مي شوند. آن گاه ساير نمره هاي تراز شده مانند نمره هاي CEEB، T،AGCT، و IQ را بر مبناي zn محاسبه مي كنيم.نرم يا هنجار: نمره هاي CEEB نمره هاي CEEB كه معمولا در آزمون هاي ورودي دانشگاه ها به كار مي روند، نمره هايي هستند كه ميانگين آن ها 500 و انحراف معيار آن ها 100 است. بنابراين براي تبديل نمره هاي z به نمره هاي CEEB كافي است از رابطه زير استفاده شود. 500 + 100 *  zn = CEEB شكل توزيع نمره هاي CEEB نيز مانند شكل توزيع نمره هاي خام افراد گروه نرم است. نمره هاي CEEB محاسبه شده براي نمره هاي مياني طبقه ها در ستون 8 جدول 8-1 نشان داده شده است.نرم يا هنجار: نمره هاي T نمره هاي T نمره هاي تراز شده اي هستند كه ميانگين آن ها 50 و انحراف معيار آن ها 10 است. براي محاسبه نمره هاي T كافي است اندازه هاي zn را در 10 ضرب كرده حاصل را با 50 جمع كنيم يعني: 50 +10* zn = Tنرم يا هنجار: نمره هاي AGCT اين نمره ها كه براي نخستين بار براي نمره هاي آزمون ارتشي طبقه بندي كلي محاسبه شد، نمره هاي تراز شده اي هستند كه با ميانگين 100 و انحراف معيار 20 محاسبه مي شوند. توزيع اين نمره ها كه همان شكل توزيع نمره هاي اوليه را دارد، در ستون 9 جدول 8-1 براي اعداد مياني هر طبقه محاسبه شده است. روش محاسبه بر اساس فرمول زير انجام مي گيرد. 100 + 20 * zn = AGCTنرم يا هنجار: نمره هاي انحرافي آزمون وكسلرهوشبهر انحرافي آزمون وكسلر داراي ميانگين 100 و انحراف معيار 15 است كه از رابطه زير به دست مي آيد.100 + 15 * zn = IQ (وكسلر)در نمره هاي تراز شده آزمون هاي فرعي اين تست ميانگين برابر 10 و انحراف معيار برابر 3 فرض شده است.نرم يا هنجار: نمره هاي هوشبهر انحرافي آزمون استنفورد- بينه در اين آزمون ميانگين برابر 100 و انحراف معيار برابر 16 فرض شده است. بنابراين محاسبه هوشبهر انحرافي در آزمون استنفورد بينه از رابطه زير به دست مي آيد. 100 + 16 * = zn IQنرم يا هنجار: نمره هاي نه بخشي نمره هاي zn را مي توان به هر نمره تراز شده و با هر ميانگين و انحراف معياري تبديل كرد. يكي از نرم هاي معروف كه براي درجه بندي افراد در نيروي هوايي آمريكا و بعدها براي مقاصد آموزشي و ارزشيابي مورد استفاده فراوان پيدا كرد، نمره هاي نه بخشي(standard nine=stanine) است. مقياس نه بخشي، كه مقياس نمره هاي تراز شده با ميانگين 5 و انحراف معيار تقريبا 2 است، اين مقياس داراي نه بخش است كه با اعداد از 1 تا 9 نشان داده مي شوند. چنان كه در نمودار(ص 240) ملاحظه مي شود، در يك توزيع نرمال درصد معيني از افراد در هر يك از 9 بخش مقياس قرار مي گيرند. پنجمين بخش اين مقياس كه ميانگين آن است به فاصله يك چهارم انحراف معيار از دو طرف ميانگين توزيع قرار  مي گيرد و ساير بخش ها نيز هر يك ، يك دوم انحراف معيار از توزيع نرمال را شامل مي شوند.نرم يا هنجار: نمره هاي نه بخشي بايد دانست كه نمره هاي 9 بخشيع نمره هاي تراز شده واقعي نيستند، زيرا بخش اول و نهم آن بي انتهاست. در نمودرا 8-1 ملاحظه مي شود كه اندازه هاي واحدها در بخش هاي 2 تا 8 يكسانند، اما بخش يك و بخش 9 گسترده تر از ساير بخش ها است.  يكي از مزيت هاي نمره هاي نه بخشي اين است كه به جاي نقاط معين، دامنه هايي از نمره ها را نشان مي دهند. اين امر موجب مي شود كه اجرا كنندگان آزمون ها تصور نكنند كه نمره هاي مشاهده شده  آزمودني ها، نمره هايي دقيق و يا اندازه هاي تغيير ناپذير خصايص رواني است.  چنان كه در بحث از خطاي معيار اندازه گيري و برآورد حدود نمره هاي واقعي آزمودني ملاحظه شد، نتيجه آزمون را نبايد يك نمره منحصر به فرد و تغيير ناپذير دانست. بلكه همواره نمره واقعي آزمودني در سطح اطمينان معين در فاصله بين دو نمره قرار مي گيرد. نمره هاي نه بخشي، نتايج آزمون ها را بر اساس اين اطمينان مشخص مي كنند.نرم يا هنجار: تاريخ تنظيم جداول نرميكي از مسايل عمده در مورد جداول نرم آن است كه اين جداول معمولا سال ها قبل تهيه و تنظيم شده اند. چون تهيه و تنظيم جداول نرم مستلزم صرف اعتبار و هزينه هاي زيادي است، بنابراين امكان تجديد نظر در آن ها محدود است. تهيه كنندگان آزمون ها معمولا هر 10 سال يك بار در جداول نرم تجديد نظر مي كنند. از آن جا كه تجارب و محيط زندگي كودكان و دانش آموزان و هم چنين برنامه ها و روش هاي آموزشي در حال تغيير است، نرم هايي كه در سال هاي گذشته تهيه شده اند در زمان حال فاقد ارزش و اعتبار كافي هستند. به عنوان مثال چون روش تدريس رياضيات امروزه لااقل در مدارس ابتدايي بهتر از سال هايپيش است، اگر دانش آموزي در يك آزمون رياضي كه نرم آن 10 سال پيش تهيه شده است رتبه 50 درصدي را به دست آوردة چنان چه با نرم امروز سنجيده شود، ممكن است رتبه درصدي وي با اين نرم كاملا متفاوت باشد. به همين دليل است كه اجرا كنندگان آزمون ها بايد تاريخ تنظيم جداول نرم آزمون را مورد توجه قرار داده و در تعبير و تفسير نتايج آزمون ها محدوديت هاي مربوط به آن را مد نظر قرار دهند.نيمرخ هاي رواني نيم رخ رواني آزمودني به صورت نموداري ارائه مي گردد كه در آن نتايج اجراي چند آزمون بر اساس نرم يا مقياس واحد نشان داده مي شود. در نيم رخ رواني، نمره هاي آزمودني در آزمون هاي مختلف و يا در آزمون هاي فرعي يك آزمون، ممكن است به صورت رتبه هاي درصدي، نمره هاي تراز شده و يا هوشبهر انحرافي نشان داده شود. نيم رخ رواني را مي توان به صورت نمودار ستوني يا نمودار چند ضلعي ترسيم كرد. براي رسم نيم رخ رواني، ابتدا دو محور عمود بر هم رسم مي كنيم و سپس روي محور افقي خصايص مورد اندازه گيري و روي محور عمودي نمره تراز شده يا نمره هنجاري خصايص اندازه گيري شده مشخص مي شود.نيمرخ هاي رواني براي تهيه نيم رخ ستوني كافي است نام صفت مورد اندازه گيري رسم گردد. در نيم رخ هاي چند ضلعي نيز به همين ترتيب عمل مي شود. در نيم رخ هاي رواني، براي سهولت تفسير نتايج آزمون ها، خطي كه حد متوسط يا بهنجار را نشان مي دهد كشيده مي شود تا نمره هاي بالاتر و يا پايين تر از حد بهنجار مشخص شوند. براي روشن تر شدن مطالب بالا به دو نمونه از نيم رخ هاي رواني مربوط به دو آزمودني همراه با تفسير نتايج آن در كتاب(شريفي، ص 245 و 246 ) توجه كنيد.ساختن آزمون هاي استانداد شده ساختن و استاندارد كردن آزمون، عملي پيچيده و فني بوده و مستلزم دانش و مهارت سطح بالاي تخصص در همه زمينه هاي روان سنجي است. سازندگان آزمون علاوه بر داشتن صلاحيت علمي و تخصصي و دانش نظري در روان سنجي، بايد در مورد انواع آزمون هاي مختلف نيز از تجارب عملي كافي برخوردار باشند اقدام به ساختن و استاندارد كردن آزمون در هر زمينه منوط به برقراري شرايط زير است: 1) آزمون هاي معتبر و استاندارد شده كافي در آن زمينه موجود نباشد. 2) سازندگان آزمون علاوه بر داشتن نيروي تخصصي در زمينه هاي مختلف روان سنجي از منابع مالي كافي برخوردار باشند. 3) آزموني كه ساخته مي شود در مورد تعداد زيادي از آزمودني ها و براي مدت نسبتا طولاني براي هدف هاي تحصيلي و شغلي، تشخيص هاي باليني و ساير مقاصد آموزشي و درماني به كار بسته شود.مراحل ساختن آزمون هاي استانداد شده 1) تعيين هدف هاي تهيه آزمون: سازندگان آزمون ابتدا بايد هدف هاي آزموني كه قصد ساختن آن را دارند تعيين كنند. براي اين كار لازم است به پرسش هاي زير توجه شود. 1- آزمون براي كدام يك از مقاصد روان سنجي مانند ارزشيابي آموزشي، راهنمايي تحصيلي، راهنمايي شغلي، گزينش و يا هدف هاي تشخيصي ساخته مي شود؟ 2- آزمون مورد نظر براي سنجش كدام يك از خصايص آزمودني ها مانند پيشرفت تحصيلي، هوش، استعداد و يا صفات شخصيت آنان به كار خواهد رفت؟ اگر آزمون پيشرفت تحصيلي است، براي سنجش پيشرفت تحصيلي آزمودني ها در چه سطحي و در مورد كدام درس ساخته مي شود؟مراحل ساختن آزمون هاي استانداد شده 1) تعيين هدف هاي تهيه آزمون(ادامه): 4- اگر آزمون از نوع آزمون هوش، استعداد و يا صفات شخصيتي است، بر اساس كدام يك از نظريه هاي روان شناسي و روان سنجي ساخنه مي شود؟ 5- محتواي آزمون مورد نظر چيست و نوع سوال هاي آن كلامي است يا غير كلامي،چند گزينه اي است و يا كوته پاسخ؟ 6- آزمون در مورد كدام گروه سني و يا كلاسي اجرا مي شود و براي چه نوع نرمي تهيه خواهد شد؛ نرم محلي، نرم منطقه اي و يا نرم ملي؟مراحل ساختن آزمون هاي استانداد شده 2- تهيه محتواي فرم تجربي آزمون پاسخ هاي دقيق سازندگان آزمون به پرسش هاي بالا و انجام بررسي هاي لازم در اين مورد با آن ها امكان مي دهد كه نسبت به تدوين محتواي آزمون به صورت فرم تجربي اقدام كنند. نظرخواهي از متخصصان موضوعي . روان شناسيان و مرور آزمون هاي مشابه كه در ساير كشورها به كار بسته شده است، سازندگان آزمون را در تدوين محتواي آزمون كمك خواهد كرد.مراحل ساختن آزمون هاي استانداد شده 2- تهيه محتواي فرم تجربي آزمون(ادامه) پس از تعيين هدف ها و محتواي آزمون، پرسش هاي آزمون نوشته مي شوند. تعداد پرسش هايي كه در فرم اوليه آزمون گنجانده مي شود، بايد بيش از تعداد پرسش هايي باشد كه در فرم نهايي يا فرم اصلي آزمون وجود خواهد داشت. علت اين امر آن است كه در مراحل تجديد نظر در پرسش ها و يا تجزيه و تحليل آن ها احتمالا برخي پرش ها حذف خوهند شد. پرسش هاي تدوين شده بايد توسط تعدادي از متخصصان موضوعي، روان شناسان و متخصصان روان سنجي مورد بررسي قرار گيرند و تجديد نظر لازم در آن ها به عمل آيد. پس از تجديد نظر در پرسش ها، فرم تجربي آزمون  تنظيم و به تعداد مورد نياز چاپ و تكثير مي شود.مراحل ساختن آزمون هاي استانداد شده 2- تهيه محتواي فرم تجربي آزمون(ادامه) در بعضي موارد سازندگان آزمون تصميم مي گيرند آزموني را كه در ساير كشورها استاندارد شده است در ايران هنجاريابي كنند. براي اين كار نخست بايد آزمون مورد نظر به فارسي ترجمه شود. ترجمه آزمون بايد به گونه اي باشد كه اگر مترجم ديگري كه به زبان فارسي و زبان اصلي آزمون مورد بحث تسلط كامل دارد، آن را به زبان اصلي(زبان خارجي) ترجمه كند، محتواي اين ترجمه با محتواي آزمون به زبان اصلي كاملا يكسان باشد.  پس از ترجمه آزمون، سازندگان آزمون ممكن است بعضي از موارد آن را كه با فرهنگ ايراني كاملا بيگانه است حذف و به جاي آن ها ماده هاي ديگري كه از نظر اصول روان سنجي همان فرايند ذهني را اندازه مي گيرند قرار دهند. پس از انجام اين كار و پس از بررسي و تجديد نظرهاي لازم، فرم تجربي آزمون تدوين و به تعداد مورد نياز چاپ و تكثير مي شود.مراحل ساختن آزمون هاي استانداد شده 3 ) اجراي فرم تجربي آزمون از جامعه هدف يعني جامعه اي كه سرانجام آزمون استاندارد شده براي سنجش خصايص آنان به كار بسته خواهد شد، با روش نمونه گيري تصادفي، يك گروه نمون انتخاب و آزمون در مورد افراد اين گروه اجرا مي شود. سپس پاسخ خاي آزمودني ها به هر يك از پرسش ها بر اساس دستوالعمل آزمون تصحيح و نمره گذاري مي شود. مراحل ساختن آزمون هاي استانداد شده 4) تجزيه و تحليل سوال هاي آزمون سوال هاي فرم تجربي آزمون كه در مورد گروه نمونه تصادفي از آزمودني ها اجرا شده است، مورد تجزيه و تحليل قرار مي گيرند(فصل 5). شخص هاي آماري هر يك از سوال ها، ضرايب همبستگي آن ها با يكديگر، با نمره كل آزمون و با ساير ملاك هاي خارجي محاسبه مي شود. سوال هاي نامناسب يعني سوال هايي كه فاقد ضريب تشخيص و اعتبار لازم بوده اند حذف مي شوند. سپس ضريب اعتبار (همساني دروني) آزمون پس از حذف سوال هاي نامناسب با استفاده از روش دو نيمه كردن، روش كودر- ريچادسون و يا ساير روش هاي مناسب برآورد مي شود. آن گاه ميانگين، انحراف معيار، خطاي معيار اندازه گيري و ساير شاخص هاي آماري آزمون محاسبه مي گردد.مراحل ساختن آزمون هاي استانداد شده 4) تجزيه و تحليل سوال هاي آزمون(ادامه) در صورتي كه ازمون داراي پرسش هاي چند گزينه اي است، اين پرسش ها نيز مورد تجزيه و تحليل قرار مي گيرند و در صورت لزومة تجديد نظر در گزينه ها و يا سوال هاي آزمون به عمل مي آيد. پس از انجام مراحل بالا، سوال هاي آزمون بر حسب سطح دشواري محاسبه شده به ترتيب از آسان به مشكل تنظيم و فزم جديد آزمون تدوين مي شود.مراحل ساختن آزمون هاي استانداد شده 5) وارسي تجزيه و تحليل سوال هاي آزمون ازموني كه بر اساس تجزيه و تحليل مرحله قبل تدوين شده است مجددا در مورد يك گروه نمونه از آزمودني ها كه به روش تصادفي از جامعه هدف انتخاب شده است اجرا مي شود. نتايج حاصل از اين آزمايش بر اساس آن چه در مرحله قبلي گفته شد، مورد تجزيه و تحليل قرار مي گيرد. با مقايسه نتايج حاصل از دو آزمايش مي توان اعتبار يافته هاي مرحله قبل را از روي نتايج اين مرحله مورد بررسي و قضاوت قرار داد. در هر حال، در اين مرحله نيز پس از حذف سوال هاي نامناسب، شاخص هاي آماري آزمون محاسبه و سوال هاي آن از آسان به مشكل تنظيم و فرم نهايي آزمون تدوين مي شود.مراحل ساختن آزمون هاي استانداد شده 6) تهيه و تنظيم جدول هاي نرم آزمون چنان چه گروه نمونه اي كه آزمون فرم تجربي در مرحله دوم در باره آن اجرا شده است به قدر كافيزياد و در سطح اطمينان لازم آماري معرف جامعه هدف بوده و هيچ يك از سوال هاي آزمون در اين مرحله حذف يا تعديل نشده باشد، مي توان از روي نمره هاي خام آزمودني ها جدول هاي نرم آزمون را تنظيم كرد. اما در هر حال بهتر است آزمون فرم نهايي بار ديگر در مورد گروه نمونه بزرگ آماري از افراد جامعه هدف اجرا شود. پس از اجراي مجدد و نمره گذاري نتايج آزمون، مي توان با استفاده از روش هاي مطرح شده در بخش اول اين فصل، پس از محاسبه ميانگين و انحراف معيار نمره هاي خام، به تهيه و تنظيم جدول هاي نرم آزمون اقدام كرد.مراحل ساختن آزمون هاي استانداد شده 6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون گر چه در مراحل استاندارد كردن آزمون برخي از شواهد روايي آزمون مانند روايي محتوايي، همبستگي هر يك از سوال ها با كل نمره ازمون(همساني دروني) به عنوان يكي از شواهد روايي سازه، و در پاره اي موارد همبستگي سوال ها با برخي ملاك هاي خارجي مورد مطالعه قرار مي گيرند، اما انجام مطالعه مستمر براي برآورد روايي ملاكي و روايي سازه آزمون تدوين شده امري اساسي است.مراحل ساختن آزمون هاي استانداد شده 6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون(ادامه) براي اين منظور، سازندگان آزمون بايد با در نظر گرفتن ملاك هاي خارجي و با مطالعه در مورد شواهد سازه آزمون، در آزمون هاي تدوين شده مي توان همبستگي نمره هاي آن ها را با نمره هاي آزمون هاي مشابهي كه قبلا در مورد جامعه هدف استاندارد شده است به عنوان يكي از شاخص هاي روايي آزمون مورد بررسي قرار داد. همبستگي بين نمره هاي آزمون هوش و استعداد و نمره هاي پيشرفت تحصيلي آزمودني ها نيز شاخص ديگري از روايي آزمون را به دست خواهد داد.مراحل ساختن آزمون هاي استانداد شده 6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون(ادامه) در آزمون هاي علايق تحصيلي، تفاوت ميانگين نمره هاي تحصيلي افراد موفق با افراد ناموفق در رشته هاي تحصيلي و هم چنين همبستگي بين نمره هاي آزمون علايق تحصيلي و درجه بندي علايق توسط معلمان مي تواند به عنوان شاهدي از روايي سازه و يا روايي ملاكي آزمون تلقي شود. در آزمون هاي شخصيت، همبستگي بين نمره هاي آزمون و صفات شخصيتي ازمودني ها كه توسط دوستان شان درجه بندي مي شود و هم چنين توافق بين نمره هاي آزمون هاي تشخيصي و باليني مانند آزمون سنجش اضطراب با درجه بندي اضطراب آزمودني ها توسط روان پزشكان و روان شناسان باليني شواهدي از روايي سازه آزمون هاي مذكور را به دست مي دهند.نكات اساسي در تهيه و استاندارد كردن آزمون ها ا) راهنماي اجراي آزمون راهنماي اجراي آزمون بايد استاندازد شده و كاملا روشن باشد. در راهنما بايد نوع كاري كه آزمودني بايد انجام دهد و چگونگي انجام آن به گونه روشن شرح داده شود. لازم است كه براي آشنا شدن آزمودني ها با نوع سوال ها و چگونگي پاسخ دادن به آن ها، چند سوال نمونه در راهنماي آزمون مطرح و طرز پاسخ دادن به آن ها توضيح داده شود.نكات اساسي در تهيه و استاندارد كردن آزمون ها ا) راهنماي اجراي آزمون در آزمون هايي كه به پاسخ هاي غلط نمره منفي داده مي شود، بايد اين نكته در راهنماي اجراي آزمون ذكر گردد. اگر قرار است به پاسخ هاي غلط نمره منفي داده نشود، اين نكته نيز بايد در راهنماي اجراي آزمون به گونه صريح مطرح شده و به آزمودني ها گفته شود كه اگر پاسخ سوالي را نمي دانند، از بين پاسخ هاي پيش نهادي يا گزينه هاي آزمون بهترين پاسخي را كه به نظرشان درست است انتخاب كنند. هم چنين در راهنماي آزمون بايد زمان استاندارد شده براي پاسخ دادن به پرسش هاي آزمون به آزمودني ها گفته شود. زمان استاندارد براي هر آزمون عبارت از ميانگين زمان صرف شده توسط 75 درصد آزمودني ها براي كامل كردن آزمون در مراحل اجراي فرم تجربي است.نكات اساسي در تهيه و استاندارد كردن آزمون ها 2- نمره گذاري آزمون آزمون بايد به گونه اي طراحي شود كه نمره گذاري پاسخ هاي آزمودني ها به آساني و به سرعت امكان پذير باشد و تا جايي كه امكان دارد نمره گذاري پاسخ ها به صورت عيني انجام گيرد. اعتبار و پايايي آزمون نبايد به سبب ناپايايي نمره گذاري آن كاهش يابد. وزن يا نمره اي كه براي هر سوال در نظر گرفته مي شود بهتر است با سطح دشواري سوال متناسب باشد. بدين معنا كه براي سوال هاي آسان وزن كمتر و براي س.ال هاي دشوار وزن بيشتري منظور شود.نكات اساسي در تهيه و استاندارد كردن آزمون ها 3- تعداد سوال هاي آزمون هر چه تعداد سوال هاي آزمون بيشتر باشد، اعتبار و پايايي آن بيشتر است. آزمون يا بايد داراي تعداد زيادي سوال باشد كه به هر يك از آن ها نمره جداگانه اي داده مي شود و يا شامل تعداد كمتري از تكاليف باشد كه به هر يك از آن ها نمره خاصي تعلق مي گيرد. گنجاندن يك سوال محاسبه اي كه يافتن پاسخ درست آن مستلزم صرف وقت زياد است سوال نامناسبي به شمار مي رود. زيرا آزمودني در ازاي چندين دقيقه وقتي كه براي پاسخ دادن به آن صرف مي كند، نمره اي برابر پاسخ درست سوال هايي مي گيرد كه با صرف چند ثانيه پاسخ درست آن ها را پيدا مي كند.بنابراين بايد زمان و سطح مهارت لازم براي پاسخ دادن به همه سوال ها در هر بخش آزمون تقريبا يكسان باشد يا نمره هر سوال با سطح دشواري و زمان لازم براي يافتن پاسخ درست آن متناسب باشد.نكات اساسي در تهيه و استاندارد كردن آزمون ها 4- سطح دشواري سوال هاي آزمون آزمون بايد با پرسش هايي شروع شود كه همه آزمودني ها به راحتي بتوانند به آن ها پاسخ درست بدهند. سوال هاي اول آزمون نبايد دشوار بوده و موجب دلسردي آزمودني ها شوند. بهد از چند سوال خيلي آسان كه در ابتداي آزمون گنجانده مي شوند، سطح دشواري سوال هاي بعدي آزمون بايد به تدريج افزايش يابد. بايد بين عملكرد آزمودني ها در هر يك از سوال ها و عملكرد آنان در كل آزمون همبستگي مثبت موجود باشد. اگر همبستگي بين يك سوال با نمره كل آزمون منفي و يا خيلي كم باشد، احتمالا بدان معناست كه آن سوال خصيصه اي را اندازه مي گيرد كه با ان چه كه به وسيله كل آزمون سنجيده مي شود تفاوت دارد.نكات اساسي در تهيه و استاندارد كردن آزمون ها 5- سوال هاي چند گزينه اي پرسش هاي چندگزينه اي به سبب آن كه نمره گذاري آن ها به آساني و به سرعت امكان پذير است، در اغلب آزمون هاي مداد- كاغذي مورد استفاده قرار مي گيرند. اما، نمره هاي حاصل از اين نوع سوال ها ممكن است تا حدي با نمره واقعي آزمودني ها متفاوت باشد. به همين دليل بعضي از سازندگان آزمون، پرسش هايي را ترجيح مي دهند كه آزمودني پاسخ ها را از خزانه حافظه خود بازيابي و آن ها را توليد كند. در آزمون هايي كه با پرسش هاي چند گزينه اي ساخته مي شوند، مي توان در ازاي هر پاسخ غلط،..... نمره (n تعداد گزينه هاي پاسخ هاست) از نمره  هاي پاسخ هاي درست آزمودني كم كرد و بدين ترتيب عامل حدس و گمان را از بين برد. البته اين در صورتي است كه براي هر پاسخ درست يك نمره در نظر گرفته شده باشد.  در آزمون هايي كه با سوال هاي 5 يا 6 گزينه اي ساخته مي شوند، احتمال يافتن تصادفي پاسخ هاي درست كمتر از سوال هاي 3 يا 4 گزينه اي است. چنان چه در مراحل استاندارد كردن آزمون از فرمول تصحيح براي حذف عامل حدس و گمان استفاده شده است، در اجرا و نمره گذاري آزمون فرم نهايي نيز بايد نمره گذاري آزمون بر همين اساس انجام گيرد.نكات اساسي در تهيه و استاندارد كردن آزمون ها 6- دامنه تغيير سوال ها آزمون ها معمولا با سوال هاي متعدد و گوناگون ساخته مي شوند. سازندگان آزمون بايد به اين نكته توجه داشته باشند كه در هر يك از بخش هاي آزمون سوال هايي را بگنجانند كه همه آن ها توانايي واحدي را بسنجند. بنابراين، در هر يك از بخش هاي فرعي آن از گنجاندن سوال هاي نامربوط به آن بخش بايد اجتناب كنند.نكات اساسي در تهيه و استاندارد كردن آزمون ها 7- محتواي آزمون در آزمون هايي كه براي اندازه گيري استعداد و توانايي شغلي به كار مي روند، بايد پرسش هايي در محتواي آزمون گنجانيده شوند كه به طور مستقيم يا غير مستقيم در موفقيت آن شغل موثر باشند. بنابراين از طرح سوال هايي كه به محفوظات، دانش نظري محض و يا آموخته هاي كلاسيك مربوطند و اغلب افراد آن ها را فراموش مي كنند بايد اجتناب شود.نكات اساسي در تهيه و استاندارد كردن آزمون ها 8- توجه به كل محتوا در ساختن آزمون هاي پيشرفت تحصيلي، سازندگان آزمون اغلب بخش هايي از محتواي درس را مورد توجه قرار مي دهند كه ساختن پرسش هاي آزمون در مورد آن ها آسان تر است. بدين ترتيب، ممكن است بعضي از جنبه هاي موضوع مورد اندازه گيري ناديده گرفته شود. اما بايد دانست روايي آزمون بسته به اين است كه محتواي آزمون تمامي جنبه هاي مهم زمينه مورد اندازه گيري را شامل شود. آزموني كه سوال هاي آن همه زمينه هاي مهم را شامل نباشد فاقد روايي محتوايي است.روش اجراي آزمون هاي ميزان شده:آزمون هاي گروهي اجراي بعضي آزمون هاي گروهي با گذراندن يك دوره كوتاه كارآموزي ميسر است. اما اجراي بعضي ديگر از آزمون ها به مهارت و تجربه طولاني تري نياز دارد. معمولا اجراي آزمون هاي گروهي در مقايسه با آزمون هاي فردي با كارآموزي كوتاه تري امكان پذير است. آزنايش كننده بايد آزمايش را چنان ماهرانه و طبق دستورالعمل استاندارد شده برگزار كند كه به هر يك از افراد آزمايش شونده امكان داده شود تا حداكثر استعداد و توانايي خود را در پاسخ دادن به پرسش هاي آزمون نشان دهد. آزمايش كننده بايد قبلا در مورد محتواي آزمون، دستورالعمل اجراي آن و ساير شرايطي كه بايد رعايت شود آگاهي لازم را به دست آورد.اجراي آزمون هاي گروهي نكات مهم در اجراي آزمون هاي استاندارد شده :  شرايطي مشابه با شرايط تهيه و استاندازد آزمون براي كليه آزمايش شوندگان فراهم شود. رعايت كامل دستورالعمل آزمون كوشش در برقراري رابطه مطلوب بين آزمايش شونده و آزمايش كننده به منظور جلب اعتماد آنان(به ويژه در آزمون هاي فردي) گذرانده دوره هاي كارآموزي عملي(علاوه بر فراگيري دانش هاي نظري)اجراي آزمون هاي گروهي 1- شرايط اجراي آزمون: 1- ايجاد شرايط فيزيكي مناسب در جلسه آزمايش(از نظر نور، تهويه، درجه گرما، راحت بودن محل نشستن) نارسايي در هر يك از عواما مذكور موجب مي شود كه ميزان كارآيي آزمايش شوندگان كاهش يابد. اين مساله در مورد آزمون هاي سرعت بيش از آزمون هاي قدرت اثر نامطلوب بر جاي مي گذارد. 2- آزمون شوندگان به راحتي صداي مجري آزمون و راهنمايي هاي او را به راحتي بشنوند. 3- اتاق آزمايش از هر نوع عامل حواس پرتي مانند سر و صدا، تابلوهاي نقاشي، زنگ تلفن، آمد و رفت افراد و صحبت هاي مراقبان جلسه و هر عامل ديگري كه باعث عدم تمركز فكري و كاهش دقت آزمايش شوتدگان مي شود، به دور باشد.اجراي آزمون هاي گروهي 1- شرايط اجراي آزمون: 4- وضعيت روحي و جسمي آزمون شونده نتيجه آزمون را تحت تاثير قرار مي دهد. بنابراين، اجراي آزمون در مورد افراد خسته، عصباني، بي ميل، بيمارو غيره موجب مي شود كه نتيجه آزمون بيانگر نمونه اي از رفتارهاي واقعي آنان نباشد. 5- نحوه برخورد و رفتار آزمايش كننده و حالات روحي او( مانند خستگي،عصبانيت صداي نارسا) مي تواند تا حد زيادي نتيجه آزمون را تحت تاثير قرار دهد.اجراي آزمون هاي گروهي - اقدامات قبل از توزيع دفترچه آزمون: 1- پيش بيني لوازم مورد نياز 2- معرفي مجري و بيان هدف كلي از اجراي آزمون به زبان ساده 3- اجتناب از به كار بردن اصطلاحات فنياجراي آزمون هاي گروهي 3- اداره جلسه آزمايش و اجراي آزمون(وظيفه مجري) ايجاد شرايط استاندارد و همراه با احساس اطمينان براي انجام آزمايش برابر دستورالعمل آزمون در نظر گرفتن يك دستيار براي هر 15 تا 20  نفر آزمايش شونده در مورد آزمايش شوندگان خردسال مانند دانش آموزان دبستان يا دوره راهنمايي توضيحات لازم مطابق دستورالعمل آزمون توسط مجري داده مي شود. اگر آزمايش شونده اي از مجري آزمون سوالي بپرسد، او نبايد در دادن پاسخ مطلبي اضافه بر آن چه كه در دستورالعمل ذكر شده است، بيان كند. اگر به پاسخ هاي غلط نمره منفي تعلق نمي گيرد، اين امر به آزمون شوندگان اعلام شود تا اگر پاسخ سوالي را نمي دانند، بهترين پاسخ را حدس بزنند. كنترل وقت آغاز و پايان جلسه با كرونومتراجراي آزمون هاي گروهي نمره گذاري پاسخ نامه ها قبل از تصحيح و نمره گذاري پاسخ نامه ها با توجه به سه نكته زير مورد بررسي قرار گيرند. 1- نبايد بيش از يك گزينه به عنوان پاسخ صحيح انتخاب شده باشد. 2- براي مواردي كه پاسخ در محل مناسب قرار داده نشده، تصميم گيري شود. 3- در صورتي كه آزمودني از روي اشتباه، پاسخ سوال بعدي را در محل سوالي قبلي كه جواب ان را نمي دانسته علامت زده باشد، پاسخ نامه وي با در نظر گرفته اشتباه در جابه جايي پاسخ ها تصحيح شود. بعد از تعيين تعداد پاسخ هاي صحيح، غلط و سفيد نمره خام آزمودني با احتساب يا بدون احتساب نمره منفي محاسبه شود.اجراي آزمون هاي فردي نكات اساسي در اجراي آزمون هاي انفرادي 1- رعايت كامل دستورالعمل آزمون 2- ايجاد شرايط فيزيكي مطلوب در اتاق آزمايش 3- ايجاد همدلي با آزمودني 4- تكرار پرسش ها( به جز آزمون هاي حافظه) 5- مرتب كردن وسايل آزمايش 6- توجه  به حالات بدني آزمودني 7- كاوش پاسخ هاي مبهم آزمودني 8- مشاهده رفتار آزمودني 9- ارزشيابي پاسخ ها (با توجه به ملاك هاي دستورالعمل) 10- جلب اعتماد آزمودني خردسال 11- آزمايش آزمودني هاي داراي عقب ماندگي ذهني در بخش هاي زماني كوتاهعوامل موثر در نتايج آزمون ها 1- تاثير آزمايش كننده ( جنسيت، سن، نژاد، سطح مهارت، برخورد اجتماعي، پايگاه حرفه اي، و پايگاه اجتماعي- اقتصادي). پژوهش نشان داده است كه رابطه گرم يا سرد آزمايش كننده در نتايج آزمايش گروهي از آزمودني ها تفاوت معني دار ايجاد كرده است. 2- تجارب پيش از آزمايش آزمودني ها. مك كارتي گروهي از دانش آموزان دبستان را دو بار با تست آدمك مورد آزمايش قرار داد. بار اول آزمودني ها پيش از آمدن به جلسه آزمايش، انشايي در باره «بهترين تجارب زندگي خود» و بار دوم انشايي در باره «بدترين تجارب زندگي خود» نوشته بودند. در آزمايش دوم هوشبهر كودكان 4 الي 5 نمره كمتر از آزمايش اول بود. اين تفاوت ممكن است به سبب آشفتگي هاي هيجاني كودكان در مرتبه دوم باشد كه در آن انشايي در باره «بدترين تجارب زندگي خود» نوشته بودند.عوامل موثر در نتايج آزمون ها 3- تمرين ها و آمادگي قبلي آزمودني ها: آشنايي آزمودني ها با نمونه هايي از آزمون ها و تمرين هاي قبلي آنان مي تواند تا حدي در نتيجه آزمايش اثر بگذارد. دليل اين تمرين، يادآوري برخي از پاسخ ها، يادگيري راه حل ها و كسب بينش نسبت به مواد آزمايش بوده است. هم چنين كساني كه در پاشخ دادن به آزمو ن ها ي مختلف تجربه زيادي دارند، اين تجربه آمادگي بيشتري براي پاسخ دادن به آزمون ها در آنان بخ وجود مي آورد. علت اين امر غالبا اعتماد به نفسي است كه اين افراد نسبت به انجام آزمون ها پيدا مي كنن كه ضمن كاهش اضطراب آنان موقعيت بهتري را بريشان فراهم مي كند.ملاحظات اخلاقي و اجتماعي در كاربرد آزمون هاروش هاي برآورد اعتبار آزمون: اعتبار بازآزمايي در مورد استفاده از روش باز آزمايي بايد نكات زير را در نظر گرفت: 1- صفت مورد اندازه گيري از صفات نسبتا پايدار باشد. 2-  آشنايي آزمودني ها با سوال هاي آزمون در آزمايش اول، ممكن است بر نمره آزمايش آن ها اثر بگذارد(اثر انتقال) و ضريب اعتبار بازآزمايي را تحت تاثير قرار دهد. به ويژه اگر فاصله دو ازمايش كوتاه باشد و از چند روز تجاوز نكند. 3- بعضي مهارت ها با تمرين بهبود مي يابند.  نمرات آزمودني ها در آزمون دوم، ممكن است بر اثر تمرين ناشي از اجراي آزمون اول افزايش يابد(اثر تمرين) 4-  اگر فاصله دو آزمون خيلي زياد باشد، ممكن است عامل يادگيري و رشد در اين امر تاثير گذار باشد.برآورد اعتبار آزمون: اعتبار بازازمايي براي مثال، اگر يك آزمون هوش در مورد گروهي از كودكان ، يك بتر در سن 4 سالگي و يك بار در سن 5 سالگي اجرا شود، ضريب همبستگي بين نمره هاي دو بار آزمايش كه مثلا 0.43 شده است ممكن است به صورت هاي زير تفسير شود: 1- ضريب اعتبار آزمون پايين است. 2- سطح هوش كودكان بر اثر رشد افزايش يافته است. 3- تركيبي از دو عامل بالا سبب شده است كه ضريب اعتبار آزمون كم شود. واقعيت اين است كه در برآورد ضريب اعتبار آزمون به طور قطع نمي توان تصميم گرفت كه كدام يك از نتيجه گيريهاي بالا درست تر است. در هر حال، در تفسي ضريب اعتبار آزمون با توجه به فاصله زماني بين دو اجراي آزمون و ويژگي هاي آزمودني ها، بسياري از عواملي را كه ممكن است در ضريب اعتبار محاسبه شده تاثير بگذارند، بايد در نظر گرفت.برآورد اعتبار آزمون: اعتبار بازآزمايي گاهي پايين بودن ضريب اعتبار بازآزمايي به اين معنا نيست كه آزمون اعتبار كافي ندارد. چه بسا خصيصه مورد اندازه گيري در فاصله دو آزمايش تغيير كرده باشد. اما اگر آزمودني براي اندازه گيري خصيصه اي ساخته شده است كه در طول زمان ثابت مي ماند، ناكافي بودن ضريب اعتبار بازآزمايي نشانگر آن است كه آزمون فاقد اعتبار لازم است.برآورد اعتبار آزمون: اعتبار آزمون هاي همتا(Parallel tests) در بعضي موارد يك آزمون داراي دو فرم همتا است، مانند آزمون هوش ريموند كتل كه به صورت دو فرم همتاي A و B تهيه شده است. دو آزمون را در صورتي همتا گويند كه هر دو براي اندازه گيري خصيصه واحدي در مورد جامعه واحدي تهيه شده باشند. گر چه سوال هاي آزمون هاي همتا كاملا يكسان نيستند، اما سطح دشواري سوال ها در هر دو فرم يكسان است. براي برآورد اعتبار آزمون هاي همتا، دو فرم آزمون را يكي پس از ديگري و بدون فاصله زماني و يا با فاصله زماني اجرا كرده، ضريب همبستگي نمره هاي حاصل از دو آزمون محاسبه مي شود.برآورد اعتبار آزمون: اعتبار آزمون هاي همتا(Parallel tests) بر خلاف باز آزمايي، در روش اجراي فرم هاي همتا، واريانس خطاي ناشي ازنمونه هاي مختلف سوال ها مورد بررسي قرار مي گيرد، و اين در صورتي است كه هر دو ازمون بدون فاصله زماني و در يك جلسه اجرا شوند. در اين مورد براي اجتناب از تاثير عامل تمرين مي توان ترتيب اجراي آزمون را در مورد گروه هاي مختلف تغيير داد. شايد مطلوب ترين روش برآورد اعتبار آزمون، اجراي فرم هاي همتاي آزمون در زمان هاي مختلف باشد. بدين ترتيب هر دو نوع خطاي اندازه گيري، يعني خطاي ناشي از نمونه هاي مختلف سوال ها و خطاي ناشي از نمونه گيري زماني در محاسبه ضريب اعتبار به حساب مي آيد. نرم يا هنجار: مفهوم نرم نرم يا هنجار عبارت است از متوسط عملكرد گروه نمونه اي از آزمودني ها كه به روش تصادفي از يك جامعه تعريف شده انتخاب مي شود.  نرم آزمون هاي استاندارد شده بر اساس توزيع نمره هاي خام گروه نمونه اي از آزمودني ها به دست مي آيد. ميانگين و نقطه 50 درصدي اين توزيع، نمونه هايي از متوسط عملكرد گروه و به عبارت ديگر نرم يا هنجار گروه است.  در آزمون هاي گروه مرجع، نرم يا هنجار مقياس محاسبه شده اي است كه نمره خام آزمودني با آن سنجيده مي شود تا عملكرد وي نسبت به متوسط عملكرد گروه مورد ارزشيابي قرار گيرد.نرم يا هنجار: مفهوم نرم براي استاندارد يا ميزان كردن يك آزمون، آن را بر اساس يك دستورالعمل استاندارد شده و تحت شرايط يكسان در باره يك گروه نمونه تصادفي انتخاب شده از جامعه اي كه آزمون در مورد آن استاندارد مي شود اجرا مي كنند. هدف عمده فرايند استاندارد كردن آزمون تعيين توزيع نمره هاي خام گروه معياريابي(گروه نرم) است. سپس نمره هاي به دست آمده به گونه اي از نمره هاي اشتقاقي(derived score)، مانند نمره هاي معادل سني، نمره هاي معادل كلاسي، رتبه هاي درصدي و يا نمره هاي تراز شده تبديل مي شوند. نرم يا هنجار: مفهوم نرم در راهنماي اجراي بيشتر آزمون هاي استاندارد شده، جداول نرم وجود دارد كه با استفاده از آن ها نمره هاي خام آزمودني ها را مي توان به نمره هاي اشتقاقي تبديل و آن ها را تفسير كرد. بدين ترتيب، نرم يك چهارچوب داوري است كه نمره خام آزمودني بر اساس آن تفسير و در باره وي قضاوت مي شود. مقايسه نمره خام آزمودني با جدول نرم به روان شناس امكان مي دهد كه موقعيت آزمودني را نسبت به توزيع نمره هاي خام ساير افراد گروه سني، كلاسي و يا جنسي او تعيين كند.نرم يا هنجار: انتخاب گروه نرم براي اين كه تفسير نمره خام آزمون به درستي انجام گيرد، نرم يا هنجار آزمون بايد با شرايط افرادي كه آزمون در مورد آنان اجرا مي شود همخواني داشته باشد. هنگامي كه نمره خام آزمودني بر اساس جدول نرم تفسير مي شود، بايد ماهيت افراد گروه نرم(سن، جنسيت، زبان مادري، گروه قومي، منطقه جغرافيايي، خصايص فرهنگي، سطح اجتماعي- اقتصادي و غيره) همواره مورد نوجه روان شناس باشد.نرم يا هنجار: انتخاب گروه نرم هنگام ميزان كردن آزمون به منظور تهيه نرم، ابتدا بايد جامعه اي كه قرار است آزمون در باره افراد آن جامعه(جامعه هدف) ميزان شود، به ئقت تعريف گردد. سپس گروه نمونه اي كه معرف اين جامعه باشد، به روش تصادفي از افراد جامعه به عنوان نمونه معياريابي انتخاب شود.  روش نمونه گيري براي انتخاب گروه نرم، ممكن است از ساده ترين روش نمونه گيري(تصادفي ساده) تا پيچيده ترين روش (نمونه گيري طبقه اي و خوشه اي) استفاده شود. بديهي است نمونه اي كه با روش نمونه گيري طبقه اي انتخاب مي شود، به دليل اين كه ار هر طبقه فرعي افراد جامعه(جنس، سن، زبان مادري و ...) نمونه هايي در گروه نرم فرار مي گيرند، بهتر از نمونه اي كه از روش تصادفي ساده انتخاب مي شود، معرف جامعه هدف خواهد بود.نرم يا هنجار: نرم هاي ملي، منطقه اي و محلي اگر جامعه هدف، به صورت كليه افراد يك كشور كه در يك يا چند صفت مشتركند تعريف شود و افراد گروه نرم از اين جامعه انتخاب گردد، نرمي كه بدين ترتيب به دست مي آيد نرم ملي يا كشوري ناميده مي شود.  بريا انتخاب افراد گروه نرم ملي به سبب گسترده و ناهمگوني جامعه ناگزير بايد از روش نمونه گيري خوشه اي و طبقه اي استفاده شود. در جوامع گسترده و ناهمگون لازم است اولا حجم نمونه انتخاب شده نسبتا زياد باشد، ثانيا طوري نمونه گيري شود كه از همه گروه هاي مختلف جامعه نمونه هايي در گروه نرم قرار گيرند.نرم يا هنجار: نرم هاي ملي، منطقه اي و محلي اگر جامعه هدف به صورت كليه افراد يك استان يا منطقه اي از يك كشور كه شامل چند استان همجوار است و در يك صفت مشتركند تعريف شود و افراد گروه نمونه از اين جامعه انتخاب گردد، جداول نرم به دست آمده از نمره هاي خام آزمودني ها، نرم منطقه اي خواهد بود. به عنوان مثال، در مراحل ميزان كردن يك آزمون هوش براي كودكان ايراني ممكن است كشور را بر اساس خصوصيات اقليمي، زبان و گويش و ساير ويژگي هاي مشترك به چند زير جامعه تقسيم و از هر زير جامعه نمونه اي انتخاب و نرم هاي متفاوتي تدوين شود. هر گاه گروه نرم از افراد يك شهر، يك بخش، قسمتي از يك شهر و يا حتي دانش آموزان يك مدرسه انتخاب شود، جدول نرمي كه بدين ترتيب بر اساس نمره هاي خام افراد گروه نرم ساخته مي شود، نرم محلي خواهد بود.نرم يا هنجار: نرم هاي سني و كلاسي نرم هاي سني و نرم هاي كلاسي از جمله نرم هايي هستند كه مصرف كنندگان آزمون ها با آن ها آشنايي دارند. نرم سني(نرم معادل سن تقويمي) نمره مياني يك آزمون است كه افراد گروه سني معيني نمره هاي برابر آن گرفته اند. نرم هاي سني بر حسب سال و ماه و با فاصله هاي يك ماه تدوين مي شوند. به عنوان مثال، نرم سني براي كودكان 5 ساله به صورت زير طبقه بندي مي شود كه در آن ها اعداد سمت چپ، نماينده سال و اعداد سمت راست نماينده ماه هستند.: 0 – 5 سال، 1 – 5 سال و... نرم هاي كلاسي در كشور هايي كه سال تحصيلي 10 ماه است، بر حسب پايه و ماه هاي سال تحصيلي با فاصله يك ماه به صورت زير طبقه بندي مي شوند كه در آن ها اعداد سمت چپ سطح يا پايه تحصيلي و اعداد سمت راست ماه هاي سال تحصيلي را نشان مي دهند. 1 – 4 سال، 2 – 4سال، 3 – 4 سال و....نرم يا هنجار: نرم هاي سني و كلاسي مثلا، طبقه 1-4، به معناي عملكرد دانش آموزان كلاس چهارم در ماه اول يال تحصيلي است. در نظام آموزشي ايران براي تهيه نرم كلاسي، چون سال تحصيلي 9 ماه است، بنابراين طبقه هاي معادل كلاسي در هر پايه تحصيلي شامل 9 طبقه خواهد بود. طبقه بندي نرم كلاسي به فاصله يك ماه بر اين فرضيه استوار است كه با گذشت ماه هاي سال تحصيلي، به تدريج و با آهنگ يكسان سطح پيشرفت دانش آموزان افزايش مي يابد. نرم سني براي سنجش خصايصي به كار مي رود كه با افزايش سن رابطه دارند مانند هوش و بعضي از استعدادهاي شناختي ديگر. نرم كلاسي براي سنجش پيشرفت تحصيلي كه با افزايش پايه تحصيلي افزايش مي يابد به كار مي رود.نرم يا هنجار: نرم هاي سني و كلاسي يكي از محدوديت هاي نرم سني و كلاسي اين است كه واحدهاي مقياس اين دو نرم در طول مقياس برابر نيستند. به عنوان مثال، تفاوت افزايش سطح پيشرفت تحصيلي در فاصله بين معادل هاي كلاسي 2-5 تا 4-5 با افزايش سطح پيشرفت تحصيلي در فاصله هاي معادل هاي كلاسي 2-8 تا4-8 برابر نيست. در عمل واحد هاي نرم سني و معادل كلاسي با افزايش سن و پايه تحصيلي مرتبا كوچك نر مي شوند. بنابراين به سبب ناهمساني در سرعت افزايش توانايي هاي مورد اندازه گيري و در نتيجه نابرابري واحدها، متخصصان اندازه گيري آموزشي و تربيتي ترجيح مي دهند از نرم هايي استفاده كنند كه واحدهاي آن ها در طول مقياس همساني بيشتري داشته باشد.نرم يا هنجار: نرم هاي سني و كلاسي اما به سبب سهولت استفاده از نرم هاي سني و كلاسي، اين نرم ها در سطح مدارس ابتدايي، كه فرض همساني نسبي آهنگ رشد بيشتر صادق باشاست، هم چنان مورد استفاده قرار مي گيرند. با وجود اين، در اين سطح نيز لازم است براي هر يك از گروه هاي سني و يا معادل هاي كلاسي، نمره هاي تراز شده يا رتبه هاي درصدي تهيه شود.نرم يا هنجار: نرم هاي سن هنجاريmodal age norms معمولا همه دانش آموزان يك پايه تحصيلي كه نرم كلاسي براي آن تهيه مي شود سن برابر ندارند و دامنه تغيير سن آن ها اغلب زياد است. با وجود اين، نمره هاي دانش آموزان خيلي جوان تر و افراد مسن تر از افراد متوسط كلاس در محاسبه نرم وارد مي شود. براي تهيه شاخص دقيق تر از متوسط نمره دانش آموزان يك پايه تحصيلي، نمره هاي افراد خيلي جوان تر و افراد خيلي مسن تر حذف و نرم بر اتساس نمره هاي دانش آموزاني كه سن آن ها با سطح پايه تحصيلي شان متناسب است محاسبه مي شود. نرم كلاسي كه بدين ترتيب به دست مي آيد، نرم سني هنجاري ناميده مي شود.نرم يا هنجار: نرم هاي سن عقليmental age norms اصطلاح سن عقلي توسط آلفرد بينه، روان شناس فرانسوي مطرح شد و امروزه در بيشتر آزمون هاي هوشي مورد استفاده قرار مي گيرد. سن عقلي يك آزمودني معين برابر سن تقويمي آن دسته از كودكان همسال او در يك گروه هنجاريابي است كه نمره مياني آن ها با نمره آزمودني مورد نظر برابر باشد. معمولا در مدارس عقب مانده هاي ذهني، طبقه بندي دانش آموزان براي هدف هاي آموزشي بر مبناي سن عقلي انجام مي گيرد.نرم يا هنجار: خارج قسمت هاquotients يكي از روش هاي قديمي تهيه نرمة كه اكنون تقريبا كنار گذاشته شده است، تبديل نرم سني آزمودني به نوعي خارج قسمت بود كه از تقسيم نمره سني يا سن عقلي بر سن تقويمي و ضرب آن در عدد 100به دست آمد. بدين ترتيب خارج قسمت هوش در فرم قديمي آزمون استنفورد بينه از رابطه زير محاسبه مي شد.      (MA/CA) 100 = IQ در اين رابطه، IQ خارج قسمت هوش يا هوشبهر، MA سن عقلي و CA سن تقويمي آزمودني است. هم چنين خارج قسمت تحصيلي(educational quotient) در بعضي از آزمون هاي پيش رفت تحصيلي از راه تقسيم نرم سني بر سن تقويمي به دست مي آمد. نرم يا هنجار: نرم هاي درصدي نرم هاي درصدي بر اساس نمره هاي خام آزمودني هاي گرو نرم كه با فاصله طبقه اي معين طبقه بندي مي شوند، به دست مي آيد. هر نمره خام را نمره درصدي(percentile) و درصد افراد نرم را كه زير نمره معيني قرار ميگيرد رتبه درصدي(percentile rank) مي نامند. به عنوان مثال، در جدول شماره 1 نمره 72 در طبقه دوم از بالا نمره درصدي است كه رتبه درصدي آن 97 است، يعني نمره 97 درصد افراد زير آن قرار دارد.نرم يا هنجار: نرم هاي درصدي براي روشن شدن روش محاسبه نرم درصدي به جدول شماره 8-1 توجه كنيد. در اولين ستون سمت چپ جدول، فاصله نمره ها با فاصله طبقه اي 5، در ستون دوم اعداد مياني هر طبقه و بالاخره تراكمي زير اعداد مياني طبقه ها را نشان مي دهد. براي محاسبه فراواني تراكمي زير عدد مياني هر طبقه كافي است نصف فراواني مطلق آن طبقه را با مجموع فراواني هاي مطلق طبقه هاي پايين تر جمع كنيم. به عنوان مثال، فراواني تراكمي زير عدد مياني براي پايين ترين طبقه برابر 0/5(0/5=يك دوم + 0 ) و براي دومين طبقه از پايين برابر 7/5 است.(7/5=13:2 + 1). رتبه درصدي هر طبقه از حاصل ضرب فراواني تراكمر زير عدد مياني آن طبقه در N : 100 به دست مي ايد. (N مجموع فراواني هاي مطلق و يا تعداد افراد گروه نرم است).نرم يا هنجار: نرم هاي درصدينرم يا هنجار: نرم هاي درصدي به سبب سهولت محاسبه و تفسير رتبه هاي درصدي، در جدول هاي نرم بيشتر آزمون هاي استاندارد شده از اين نرم استفاده مي شود. در اين جدول ها، نرم هاي درصدي براي گروه هاي سني، پايه هاي تحصيلي، شغلي، جنسيت و ساير گروه هاي محاسبه مي شود. نا همساني واحدهاي رتبه ها در نرم هاي درصدي نيز مانند نرم هاي سني و كلاسي از جمله محدوديت هاي نرم درصدي است. چنان كه از نمودار 8-1 ملاحظه مي شود، واحد هاي رتبه هاي درصدي از نوع مقياس رتبه اي هستند نه مقياس فاصله اي. با توجه به نمودار شماره 8-1 ملاحظه مي شود كه فاصله بين رتبه هاي درصدي 5 و 0 يا 90 و 95 بزرگ تر از فاصله بين رتبه هاي 40 و 45 يا 60 و 65 است. با وجودي كه تفاوت عددي هر دسته از اين دو رتبه با يكديگر برابرند، اما اندازه رتبه هاي درصدي برابر نيستند. زيرا به سبب خاصيت زنگوله اي بودن نمره ها، هر چه از دو حد انتهايي توزيع به حد وسط نزديك تر مي شويم اندازه رتبه ها مرتبا كاهش مي يابند.نرم يا هنجار: نرم هاي درصدي به سبب انباشته شدن رتبه هاي درصدي در وسط و پراكندگي آن ها در دو انتهاي توزيع، تفسير تغييرات و تفاوت هاي نرم هاي درصدي دشوار مي شود. به عنوان مثال، تفاوت پيشرفت تحصيلي دو دانش آموز كه يكي رتبه 5 درصدي و ديگري رتبه 10 درصدي گرفته است، با تفاوت دو دانش آموز ديگر كه رتبه درصدي يكي 40 و رتبه درصدي ديگري 45 است، برابر نيست. تفاوت بين رتبه هاي 5 و 10 درصدي بيشتر از تفاوت بين رتبه هاي 40 و 45 درصدي است، زيرا واحدهاي مقياس در مورد دو رتبه اول بزرگ تر از واحد هاي رتبه ها ي دوم است.  با وجود اين، چنان چه استفاده كنندگان از اين نرم، به نابرابري واحدهاي رتبه ها در طول مقياس توجه كنند و براي تفاوت رتبه هاي انتهايي در مقايسه با رتبه هاي مياني، وزن بيشتري قايل باشند، مي توانند آن ها را به گونه اي روشن تر تفسير كنند.نرم يا هنجار: نرم نمره هاي تراز شده(standard score norms)بر خلاف نرم درصدي، نمره هاي تراز شده از نوع مقياس فاصله اي هستند كه اندازه واحدهاي آن ها در سرتاسر مقياس برابرند. نمره هاي تراز شده، نمره هاي تبديل شده اي هستند كه مي توان آن ها را بر حسب ميانگين و انحراف معيار دلخواه محاسبه كرد. نمره هاي تراز شده انئاع مختلف دارند كه از آن جمله اند نمره هاي z، نمره هاي Z، نمره هاي CEEB(Colledge Entrance Examination Bord، نمره هاي امتحانات ورودي دانشگاه ها)، نمره هاي AGCT(Army General Classification Test، آزمون هاي ارتشي آلفا و بتا)، هوشبهر انحرافي(deviation  IQ)، نمره هاي نه بخشي(stanine scores)، و نمره هاي T .در عمل همه اين نرم ها بر مبناي نمره z محاسبه مي شوند.نرم يا هنجار: نرم نمره هاي تراز شده به نمودار ص 240 كتاب شريفي(1377) مراجعه نماييد.نرم يا هنجار: نمره z نمره z از رابطه زير به دست مي آيد. در اين رابطه، X نمره خام،    ميانگين نمره هاي خام افراد گروه نرم و s انحراف معيار نمره هاي خام افراد گروه نرم است. با تبديل نمره هاي خام به نمره z توزيع جديدي به دست مي آيد كه ميانگين آن برابر با صفر و انحراف معيار آن برابر يك است. شكل منحني توزيع جديد با شكل توزيع نمره هاي خام آن يكسان است. در جدول شماره 8-1 نمره هاي z اعداد مياني طبقه ها در ستون 6 نشان داده شده است. به عنوان مثال، نمره z براي اعداد ميانياولين طبقه از بالا 2/59 است. در نمودار 8-1 نيز در خط پايه منحني نمره z از 4- تا 4+ نشان داده شده است.نرم يا هنجار: نمره هاي Z چون نمره z داراي ارقام اعشاري و نيمي از اين نمره ها در توزيع نرمال منفي است، بنابراين كاركردن با اين نمره ها تا اندازه اي دشوار است. اگر نمره z را در عدد ثابت 10 ضرب و حاصل ضرب را با عدد ثابت 50 جمع كنيم نمره هاي Z به دست مي آيد كه ميانگين آن ها 50 و انحراف معيار آن ها 10 است. شكل توزيع نمره هاي Z نيز مانند توزيع نمره هاي اصلي افراد گروه نرم با آن يكسان است. نمره هاي Z در ستون 7 جدول 8 – 1 نشان داده شده اند.نرم يا هنجار: نمره هاي تراز شده بهنجار(نرمال) شده همه نرم هاي نمره هاي تراز شده كه در بالا به آن ها اشاره شد، تبديل خطي ساده نمره هاي خام هستند. ميانگين و انحراف معيار توزيع نمره هاي تبديل شده با ميانگين و انحراف معيار نمره هاي خام تفاوت مي كند، اما شكل توزيع در هر دو مورد يكسان است. تبديل گروهي از نمره هاي خام به نمره هاي تراز به هنجار شده با محاسبه رتبه هاي درصدي نمره هاي خام شروع مي ود. سپس با استفاده از جدول سطح منحني نرمال، نمره هاي z هر يك از رتبه هاي درصدي به دست مي آيد.  فرض كنيد مي خواهيم عدد مياني(ستون 2) جدول شماره 8-1 را به نمره هاي تراز به هنجار شده تبديل كنيم. چون رتبه هاي درصدي اين نمره ها محاسبه شده است(ستون 5)، لذا كافي است اين رتبه ها را با تقسيم كردن بر صد به نسبت تبديل كرده و سپس z مربوط به آن را از جدول سطح منحني نرمال پيدا كنيم. نمره هاي z كه بدين طريق به دست مي آيند با علامتzn يعني نمره هاي z نرمال شده نشان داده مي شوند. آن گاه ساير نمره هاي تراز شده مانند نمره هاي CEEB، T،AGCT، و IQ را بر مبناي zn محاسبه مي كنيم.نرم يا هنجار: نمره هاي CEEB نمره هاي CEEB كه معمولا در آزمون هاي ورودي دانشگاه ها به كار مي روند، نمره هايي هستند كه ميانگين آن ها 500 و انحراف معيار آن ها 100 است. بنابراين براي تبديل نمره هاي z به نمره هاي CEEB كافي است از رابطه زير استفاده شود. 500 + 100 *  zn = CEEB شكل توزيع نمره هاي CEEB نيز مانند شكل توزيع نمره هاي خام افراد گروه نرم است. نمره هاي CEEB محاسبه شده براي نمره هاي مياني طبقه ها در ستون 8 جدول 8-1 نشان داده شده است.نرم يا هنجار: نمره هاي T نمره هاي T نمره هاي تراز شده اي هستند كه ميانگين آن ها 50 و انحراف معيار آن ها 10 است. براي محاسبه نمره هاي T كافي است اندازه هاي zn را در 10 ضرب كرده حاصل را با 50 جمع كنيم يعني: 50 +10* zn = Tنرم يا هنجار: نمره هاي AGCT اين نمره ها كه براي نخستين بار براي نمره هاي آزمون ارتشي طبقه بندي كلي محاسبه شد، نمره هاي تراز شده اي هستند كه با ميانگين 100 و انحراف معيار 20 محاسبه مي شوند. توزيع اين نمره ها كه همان شكل توزيع نمره هاي اوليه را دارد، در ستون 9 جدول 8-1 براي اعداد مياني هر طبقه محاسبه شده است. روش محاسبه بر اساس فرمول زير انجام مي گيرد. 100 + 20 * zn = AGCTنرم يا هنجار: نمره هاي انحرافي آزمون وكسلرهوشبهر انحرافي آزمون وكسلر داراي ميانگين 100 و انحراف معيار 15 است كه از رابطه زير به دست مي آيد.100 + 15 * zn = IQ (وكسلر)در نمره هاي تراز شده آزمون هاي فرعي اين تست ميانگين برابر 10 و انحراف معيار برابر 3 فرض شده است.نرم يا هنجار: نمره هاي هوشبهر انحرافي آزمون استنفورد- بينه در اين آزمون ميانگين برابر 100 و انحراف معيار برابر 16 فرض شده است. بنابراين محاسبه هوشبهر انحرافي در آزمون استنفورد بينه از رابطه زير به دست مي آيد. 100 + 16 * = zn IQنرم يا هنجار: نمره هاي نه بخشي نمره هاي zn را مي توان به هر نمره تراز شده و با هر ميانگين و انحراف معياري تبديل كرد. يكي از نرم هاي معروف كه براي درجه بندي افراد در نيروي هوايي آمريكا و بعدها براي مقاصد آموزشي و ارزشيابي مورد استفاده فراوان پيدا كرد، نمره هاي نه بخشي(standard nine=stanine) است. مقياس نه بخشي، كه مقياس نمره هاي تراز شده با ميانگين 5 و انحراف معيار تقريبا 2 است، اين مقياس داراي نه بخش است كه با اعداد از 1 تا 9 نشان داده مي شوند. چنان كه در نمودار(ص 240) ملاحظه مي شود، در يك توزيع نرمال درصد معيني از افراد در هر يك از 9 بخش مقياس قرار مي گيرند. پنجمين بخش اين مقياس كه ميانگين آن است به فاصله يك چهارم انحراف معيار از دو طرف ميانگين توزيع قرار  مي گيرد و ساير بخش ها نيز هر يك ، يك دوم انحراف معيار از توزيع نرمال را شامل مي شوند.نرم يا هنجار: نمره هاي نه بخشي بايد دانست كه نمره هاي 9 بخشيع نمره هاي تراز شده واقعي نيستند، زيرا بخش اول و نهم آن بي انتهاست. در نمودرا 8-1 ملاحظه مي شود كه اندازه هاي واحدها در بخش هاي 2 تا 8 يكسانند، اما بخش يك و بخش 9 گسترده تر از ساير بخش ها است.  يكي از مزيت هاي نمره هاي نه بخشي اين است كه به جاي نقاط معين، دامنه هايي از نمره ها را نشان مي دهند. اين امر موجب مي شود كه اجرا كنندگان آزمون ها تصور نكنند كه نمره هاي مشاهده شده  آزمودني ها، نمره هايي دقيق و يا اندازه هاي تغيير ناپذير خصايص رواني است.  چنان كه در بحث از خطاي معيار اندازه گيري و برآورد حدود نمره هاي واقعي آزمودني ملاحظه شد، نتيجه آزمون را نبايد يك نمره منحصر به فرد و تغيير ناپذير دانست. بلكه همواره نمره واقعي آزمودني در سطح اطمينان معين در فاصله بين دو نمره قرار مي گيرد. نمره هاي نه بخشي، نتايج آزمون ها را بر اساس اين اطمينان مشخص مي كنند.نرم يا هنجار: تاريخ تنظيم جداول نرميكي از مسايل عمده در مورد جداول نرم آن است كه اين جداول معمولا سال ها قبل تهيه و تنظيم شده اند. چون تهيه و تنظيم جداول نرم مستلزم صرف اعتبار و هزينه هاي زيادي است، بنابراين امكان تجديد نظر در آن ها محدود است. تهيه كنندگان آزمون ها معمولا هر 10 سال يك بار در جداول نرم تجديد نظر مي كنند. از آن جا كه تجارب و محيط زندگي كودكان و دانش آموزان و هم چنين برنامه ها و روش هاي آموزشي در حال تغيير است، نرم هايي كه در سال هاي گذشته تهيه شده اند در زمان حال فاقد ارزش و اعتبار كافي هستند. به عنوان مثال چون روش تدريس رياضيات امروزه لااقل در مدارس ابتدايي بهتر از سال هايپيش است، اگر دانش آموزي در يك آزمون رياضي كه نرم آن 10 سال پيش تهيه شده است رتبه 50 درصدي را به دست آوردة چنان چه با نرم امروز سنجيده شود، ممكن است رتبه درصدي وي با اين نرم كاملا متفاوت باشد. به همين دليل است كه اجرا كنندگان آزمون ها بايد تاريخ تنظيم جداول نرم آزمون را مورد توجه قرار داده و در تعبير و تفسير نتايج آزمون ها محدوديت هاي مربوط به آن را مد نظر قرار دهند.نيمرخ هاي رواني نيم رخ رواني آزمودني به صورت نموداري ارائه مي گردد كه در آن نتايج اجراي چند آزمون بر اساس نرم يا مقياس واحد نشان داده مي شود. در نيم رخ رواني، نمره هاي آزمودني در آزمون هاي مختلف و يا در آزمون هاي فرعي يك آزمون، ممكن است به صورت رتبه هاي درصدي، نمره هاي تراز شده و يا هوشبهر انحرافي نشان داده شود. نيم رخ رواني را مي توان به صورت نمودار ستوني يا نمودار چند ضلعي ترسيم كرد. براي رسم نيم رخ رواني، ابتدا دو محور عمود بر هم رسم مي كنيم و سپس روي محور افقي خصايص مورد اندازه گيري و روي محور عمودي نمره تراز شده يا نمره هنجاري خصايص اندازه گيري شده مشخص مي شود.نيمرخ هاي رواني براي تهيه نيم رخ ستوني كافي است نام صفت مورد اندازه گيري رسم گردد. در نيم رخ هاي چند ضلعي نيز به همين ترتيب عمل مي شود. در نيم رخ هاي رواني، براي سهولت تفسير نتايج آزمون ها، خطي كه حد متوسط يا بهنجار را نشان مي دهد كشيده مي شود تا نمره هاي بالاتر و يا پايين تر از حد بهنجار مشخص شوند. براي روشن تر شدن مطالب بالا به دو نمونه از نيم رخ هاي رواني مربوط به دو آزمودني همراه با تفسير نتايج آن در كتاب(شريفي، ص 245 و 246 ) توجه كنيد.ساختن آزمون هاي استانداد شده ساختن و استاندارد كردن آزمون، عملي پيچيده و فني بوده و مستلزم دانش و مهارت سطح بالاي تخصص در همه زمينه هاي روان سنجي است. سازندگان آزمون علاوه بر داشتن صلاحيت علمي و تخصصي و دانش نظري در روان سنجي، بايد در مورد انواع آزمون هاي مختلف نيز از تجارب عملي كافي برخوردار باشند اقدام به ساختن و استاندارد كردن آزمون در هر زمينه منوط به برقراري شرايط زير است: 1) آزمون هاي معتبر و استاندارد شده كافي در آن زمينه موجود نباشد. 2) سازندگان آزمون علاوه بر داشتن نيروي تخصصي در زمينه هاي مختلف روان سنجي از منابع مالي كافي برخوردار باشند. 3) آزموني كه ساخته مي شود در مورد تعداد زيادي از آزمودني ها و براي مدت نسبتا طولاني براي هدف هاي تحصيلي و شغلي، تشخيص هاي باليني و ساير مقاصد آموزشي و درماني به كار بسته شود.مراحل ساختن آزمون هاي استانداد شده 1) تعيين هدف هاي تهيه آزمون: سازندگان آزمون ابتدا بايد هدف هاي آزموني كه قصد ساختن آن را دارند تعيين كنند. براي اين كار لازم است به پرسش هاي زير توجه شود. 1- آزمون براي كدام يك از مقاصد روان سنجي مانند ارزشيابي آموزشي، راهنمايي تحصيلي، راهنمايي شغلي، گزينش و يا هدف هاي تشخيصي ساخته مي شود؟ 2- آزمون مورد نظر براي سنجش كدام يك از خصايص آزمودني ها مانند پيشرفت تحصيلي، هوش، استعداد و يا صفات شخصيت آنان به كار خواهد رفت؟ اگر آزمون پيشرفت تحصيلي است، براي سنجش پيشرفت تحصيلي آزمودني ها در چه سطحي و در مورد كدام درس ساخته مي شود؟مراحل ساختن آزمون هاي استانداد شده 1) تعيين هدف هاي تهيه آزمون(ادامه): 4- اگر آزمون از نوع آزمون هوش، استعداد و يا صفات شخصيتي است، بر اساس كدام يك از نظريه هاي روان شناسي و روان سنجي ساخنه مي شود؟ 5- محتواي آزمون مورد نظر چيست و نوع سوال هاي آن كلامي است يا غير كلامي،چند گزينه اي است و يا كوته پاسخ؟ 6- آزمون در مورد كدام گروه سني و يا كلاسي اجرا مي شود و براي چه نوع نرمي تهيه خواهد شد؛ نرم محلي، نرم منطقه اي و يا نرم ملي؟مراحل ساختن آزمون هاي استانداد شده 2- تهيه محتواي فرم تجربي آزمون پاسخ هاي دقيق سازندگان آزمون به پرسش هاي بالا و انجام بررسي هاي لازم در اين مورد با آن ها امكان مي دهد كه نسبت به تدوين محتواي آزمون به صورت فرم تجربي اقدام كنند. نظرخواهي از متخصصان موضوعي . روان شناسيان و مرور آزمون هاي مشابه كه در ساير كشورها به كار بسته شده است، سازندگان آزمون را در تدوين محتواي آزمون كمك خواهد كرد.مراحل ساختن آزمون هاي استانداد شده 2- تهيه محتواي فرم تجربي آزمون(ادامه) پس از تعيين هدف ها و محتواي آزمون، پرسش هاي آزمون نوشته مي شوند. تعداد پرسش هايي كه در فرم اوليه آزمون گنجانده مي شود، بايد بيش از تعداد پرسش هايي باشد كه در فرم نهايي يا فرم اصلي آزمون وجود خواهد داشت. علت اين امر آن است كه در مراحل تجديد نظر در پرسش ها و يا تجزيه و تحليل آن ها احتمالا برخي پرش ها حذف خوهند شد. پرسش هاي تدوين شده بايد توسط تعدادي از متخصصان موضوعي، روان شناسان و متخصصان روان سنجي مورد بررسي قرار گيرند و تجديد نظر لازم در آن ها به عمل آيد. پس از تجديد نظر در پرسش ها، فرم تجربي آزمون  تنظيم و به تعداد مورد نياز چاپ و تكثير مي شود.مراحل ساختن آزمون هاي استانداد شده 2- تهيه محتواي فرم تجربي آزمون(ادامه) در بعضي موارد سازندگان آزمون تصميم مي گيرند آزموني را كه در ساير كشورها استاندارد شده است در ايران هنجاريابي كنند. براي اين كار نخست بايد آزمون مورد نظر به فارسي ترجمه شود. ترجمه آزمون بايد به گونه اي باشد كه اگر مترجم ديگري كه به زبان فارسي و زبان اصلي آزمون مورد بحث تسلط كامل دارد، آن را به زبان اصلي(زبان خارجي) ترجمه كند، محتواي اين ترجمه با محتواي آزمون به زبان اصلي كاملا يكسان باشد.  پس از ترجمه آزمون، سازندگان آزمون ممكن است بعضي از موارد آن را كه با فرهنگ ايراني كاملا بيگانه است حذف و به جاي آن ها ماده هاي ديگري كه از نظر اصول روان سنجي همان فرايند ذهني را اندازه مي گيرند قرار دهند. پس از انجام اين كار و پس از بررسي و تجديد نظرهاي لازم، فرم تجربي آزمون تدوين و به تعداد مورد نياز چاپ و تكثير مي شود.مراحل ساختن آزمون هاي استانداد شده 3 ) اجراي فرم تجربي آزمون از جامعه هدف يعني جامعه اي كه سرانجام آزمون استاندارد شده براي سنجش خصايص آنان به كار بسته خواهد شد، با روش نمونه گيري تصادفي، يك گروه نمون انتخاب و آزمون در مورد افراد اين گروه اجرا مي شود. سپس پاسخ خاي آزمودني ها به هر يك از پرسش ها بر اساس دستوالعمل آزمون تصحيح و نمره گذاري مي شود. مراحل ساختن آزمون هاي استانداد شده 4) تجزيه و تحليل سوال هاي آزمون سوال هاي فرم تجربي آزمون كه در مورد گروه نمونه تصادفي از آزمودني ها اجرا شده است، مورد تجزيه و تحليل قرار مي گيرند(فصل 5). شخص هاي آماري هر يك از سوال ها، ضرايب همبستگي آن ها با يكديگر، با نمره كل آزمون و با ساير ملاك هاي خارجي محاسبه مي شود. سوال هاي نامناسب يعني سوال هايي كه فاقد ضريب تشخيص و اعتبار لازم بوده اند حذف مي شوند. سپس ضريب اعتبار (همساني دروني) آزمون پس از حذف سوال هاي نامناسب با استفاده از روش دو نيمه كردن، روش كودر- ريچادسون و يا ساير روش هاي مناسب برآورد مي شود. آن گاه ميانگين، انحراف معيار، خطاي معيار اندازه گيري و ساير شاخص هاي آماري آزمون محاسبه مي گردد.مراحل ساختن آزمون هاي استانداد شده 4) تجزيه و تحليل سوال هاي آزمون(ادامه) در صورتي كه ازمون داراي پرسش هاي چند گزينه اي است، اين پرسش ها نيز مورد تجزيه و تحليل قرار مي گيرند و در صورت لزومة تجديد نظر در گزينه ها و يا سوال هاي آزمون به عمل مي آيد. پس از انجام مراحل بالا، سوال هاي آزمون بر حسب سطح دشواري محاسبه شده به ترتيب از آسان به مشكل تنظيم و فزم جديد آزمون تدوين مي شود.مراحل ساختن آزمون هاي استانداد شده 5) وارسي تجزيه و تحليل سوال هاي آزمون ازموني كه بر اساس تجزيه و تحليل مرحله قبل تدوين شده است مجددا در مورد يك گروه نمونه از آزمودني ها كه به روش تصادفي از جامعه هدف انتخاب شده است اجرا مي شود. نتايج حاصل از اين آزمايش بر اساس آن چه در مرحله قبلي گفته شد، مورد تجزيه و تحليل قرار مي گيرد. با مقايسه نتايج حاصل از دو آزمايش مي توان اعتبار يافته هاي مرحله قبل را از روي نتايج اين مرحله مورد بررسي و قضاوت قرار داد. در هر حال، در اين مرحله نيز پس از حذف سوال هاي نامناسب، شاخص هاي آماري آزمون محاسبه و سوال هاي آن از آسان به مشكل تنظيم و فرم نهايي آزمون تدوين مي شود.مراحل ساختن آزمون هاي استانداد شده 6) تهيه و تنظيم جدول هاي نرم آزمون چنان چه گروه نمونه اي كه آزمون فرم تجربي در مرحله دوم در باره آن اجرا شده است به قدر كافيزياد و در سطح اطمينان لازم آماري معرف جامعه هدف بوده و هيچ يك از سوال هاي آزمون در اين مرحله حذف يا تعديل نشده باشد، مي توان از روي نمره هاي خام آزمودني ها جدول هاي نرم آزمون را تنظيم كرد. اما در هر حال بهتر است آزمون فرم نهايي بار ديگر در مورد گروه نمونه بزرگ آماري از افراد جامعه هدف اجرا شود. پس از اجراي مجدد و نمره گذاري نتايج آزمون، مي توان با استفاده از روش هاي مطرح شده در بخش اول اين فصل، پس از محاسبه ميانگين و انحراف معيار نمره هاي خام، به تهيه و تنظيم جدول هاي نرم آزمون اقدام كرد.مراحل ساختن آزمون هاي استانداد شده 6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون گر چه در مراحل استاندارد كردن آزمون برخي از شواهد روايي آزمون مانند روايي محتوايي، همبستگي هر يك از سوال ها با كل نمره ازمون(همساني دروني) به عنوان يكي از شواهد روايي سازه، و در پاره اي موارد همبستگي سوال ها با برخي ملاك هاي خارجي مورد مطالعه قرار مي گيرند، اما انجام مطالعه مستمر براي برآورد روايي ملاكي و روايي سازه آزمون تدوين شده امري اساسي است.مراحل ساختن آزمون هاي استانداد شده 6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون(ادامه) براي اين منظور، سازندگان آزمون بايد با در نظر گرفتن ملاك هاي خارجي و با مطالعه در مورد شواهد سازه آزمون، در آزمون هاي تدوين شده مي توان همبستگي نمره هاي آن ها را با نمره هاي آزمون هاي مشابهي كه قبلا در مورد جامعه هدف استاندارد شده است به عنوان يكي از شاخص هاي روايي آزمون مورد بررسي قرار داد. همبستگي بين نمره هاي آزمون هوش و استعداد و نمره هاي پيشرفت تحصيلي آزمودني ها نيز شاخص ديگري از روايي آزمون را به دست خواهد داد.مراحل ساختن آزمون هاي استانداد شده 6) مطالعه در مورد روايي ملاكي و روايي سازه آزمون(ادامه) در آزمون هاي علايق تحصيلي، تفاوت ميانگين نمره هاي تحصيلي افراد موفق با افراد ناموفق در رشته هاي تحصيلي و هم چنين همبستگي بين نمره هاي آزمون علايق تحصيلي و درجه بندي علايق توسط معلمان مي تواند به عنوان شاهدي از روايي سازه و يا روايي ملاكي آزمون تلقي شود. در آزمون هاي شخصيت، همبستگي بين نمره هاي آزمون و صفات شخصيتي ازمودني ها كه توسط دوستان شان درجه بندي مي شود و هم چنين توافق بين نمره هاي آزمون هاي تشخيصي و باليني مانند آزمون سنجش اضطراب با درجه بندي اضطراب آزمودني ها توسط روان پزشكان و روان شناسان باليني شواهدي از روايي سازه آزمون هاي مذكور را به دست مي دهند.نكات اساسي در تهيه و استاندارد كردن آزمون ها ا) راهنماي اجراي آزمون راهنماي اجراي آزمون بايد استاندازد شده و كاملا روشن باشد. در راهنما بايد نوع كاري كه آزمودني بايد انجام دهد و چگونگي انجام آن به گونه روشن شرح داده شود. لازم است كه براي آشنا شدن آزمودني ها با نوع سوال ها و چگونگي پاسخ دادن به آن ها، چند سوال نمونه در راهنماي آزمون مطرح و طرز پاسخ دادن به آن ها توضيح داده شود.نكات اساسي در تهيه و استاندارد كردن آزمون ها ا) راهنماي اجراي آزمون در آزمون هايي كه به پاسخ هاي غلط نمره منفي داده مي شود، بايد اين نكته در راهنماي اجراي آزمون ذكر گردد. اگر قرار است به پاسخ هاي غلط نمره منفي داده نشود، اين نكته نيز بايد در راهنماي اجراي آزمون به گونه صريح مطرح شده و به آزمودني ها گفته شود كه اگر پاسخ سوالي را نمي دانند، از بين پاسخ هاي پيش نهادي يا گزينه هاي آزمون بهترين پاسخي را كه به نظرشان درست است انتخاب كنند. هم چنين در راهنماي آزمون بايد زمان استاندارد شده براي پاسخ دادن به پرسش هاي آزمون به آزمودني ها گفته شود. زمان استاندارد براي هر آزمون عبارت از ميانگين زمان صرف شده توسط 75 درصد آزمودني ها براي كامل كردن آزمون در مراحل اجراي فرم تجربي است.نكات اساسي در تهيه و استاندارد كردن آزمون ها 2- نمره گذاري آزمون آزمون بايد به گونه اي طراحي شود كه نمره گذاري پاسخ هاي آزمودني ها به آساني و به سرعت امكان پذير باشد و تا جايي كه امكان دارد نمره گذاري پاسخ ها به صورت عيني انجام گيرد. اعتبار و پايايي آزمون نبايد به سبب ناپايايي نمره گذاري آن كاهش يابد. وزن يا نمره اي كه براي هر سوال در نظر گرفته مي شود بهتر است با سطح دشواري سوال متناسب باشد. بدين معنا كه براي سوال هاي آسان وزن كمتر و براي س.ال هاي دشوار وزن بيشتري منظور شود.نكات اساسي در تهيه و استاندارد كردن آزمون ها 3- تعداد سوال هاي آزمون هر چه تعداد سوال هاي آزمون بيشتر باشد، اعتبار و پايايي آن بيشتر است. آزمون يا بايد داراي تعداد زيادي سوال باشد كه به هر يك از آن ها نمره جداگانه اي داده مي شود و يا شامل تعداد كمتري از تكاليف باشد كه به هر يك از آن ها نمره خاصي تعلق مي گيرد. گنجاندن يك سوال محاسبه اي كه يافتن پاسخ درست آن مستلزم صرف وقت زياد است سوال نامناسبي به شمار مي رود. زيرا آزمودني در ازاي چندين دقيقه وقتي كه براي پاسخ دادن به آن صرف مي كند، نمره اي برابر پاسخ درست سوال هايي مي گيرد كه با صرف چند ثانيه پاسخ درست آن ها را پيدا مي كند.بنابراين بايد زمان و سطح مهارت لازم براي پاسخ دادن به همه سوال ها در هر بخش آزمون تقريبا يكسان باشد يا نمره هر سوال با سطح دشواري و زمان لازم براي يافتن پاسخ درست آن متناسب باشد.نكات اساسي در تهيه و استاندارد كردن آزمون ها 4- سطح دشواري سوال هاي آزمون آزمون بايد با پرسش هايي شروع شود كه همه آزمودني ها به راحتي بتوانند به آن ها پاسخ درست بدهند. سوال هاي اول آزمون نبايد دشوار بوده و موجب دلسردي آزمودني ها شوند. بهد از چند سوال خيلي آسان كه در ابتداي آزمون گنجانده مي شوند، سطح دشواري سوال هاي بعدي آزمون بايد به تدريج افزايش يابد. بايد بين عملكرد آزمودني ها در هر يك از سوال ها و عملكرد آنان در كل آزمون همبستگي مثبت موجود باشد. اگر همبستگي بين يك سوال با نمره كل آزمون منفي و يا خيلي كم باشد، احتمالا بدان معناست كه آن سوال خصيصه اي را اندازه مي گيرد كه با ان چه كه به وسيله كل آزمون سنجيده مي شود تفاوت دارد.نكات اساسي در تهيه و استاندارد كردن آزمون ها 5- سوال هاي چند گزينه اي پرسش هاي چندگزينه اي به سبب آن كه نمره گذاري آن ها به آساني و به سرعت امكان پذير است، در اغلب آزمون هاي مداد- كاغذي مورد استفاده قرار مي گيرند. اما، نمره هاي حاصل از اين نوع سوال ها ممكن است تا حدي با نمره واقعي آزمودني ها متفاوت باشد. به همين دليل بعضي از سازندگان آزمون، پرسش هايي را ترجيح مي دهند كه آزمودني پاسخ ها را از خزانه حافظه خود بازيابي و آن ها را توليد كند. در آزمون هايي كه با پرسش هاي چند گزينه اي ساخته مي شوند، مي توان در ازاي هر پاسخ غلط،..... نمره (n تعداد گزينه هاي پاسخ هاست) از نمره  هاي پاسخ هاي درست آزمودني كم كرد و بدين ترتيب عامل حدس و گمان را از بين برد. البته اين در صورتي است كه براي هر پاسخ درست يك نمره در نظر گرفته شده باشد.  در آزمون هايي كه با سوال هاي 5 يا 6 گزينه اي ساخته مي شوند، احتمال يافتن تصادفي پاسخ هاي درست كمتر از سوال هاي 3 يا 4 گزينه اي است. چنان چه در مراحل استاندارد كردن آزمون از فرمول تصحيح براي حذف عامل حدس و گمان استفاده شده است، در اجرا و نمره گذاري آزمون فرم نهايي نيز بايد نمره گذاري آزمون بر همين اساس انجام گيرد.نكات اساسي در تهيه و استاندارد كردن آزمون ها 6- دامنه تغيير سوال ها آزمون ها معمولا با سوال هاي متعدد و گوناگون ساخته مي شوند. سازندگان آزمون بايد به اين نكته توجه داشته باشند كه در هر يك از بخش هاي آزمون سوال هايي را بگنجانند كه همه آن ها توانايي واحدي را بسنجند. بنابراين، در هر يك از بخش هاي فرعي آن از گنجاندن سوال هاي نامربوط به آن بخش بايد اجتناب كنند.نكات اساسي در تهيه و استاندارد كردن آزمون ها 7- محتواي آزمون در آزمون هايي كه براي اندازه گيري استعداد و توانايي شغلي به كار مي روند، بايد پرسش هايي در محتواي آزمون گنجانيده شوند كه به طور مستقيم يا غير مستقيم در موفقيت آن شغل موثر باشند. بنابراين از طرح سوال هايي كه به محفوظات، دانش نظري محض و يا آموخته هاي كلاسيك مربوطند و اغلب افراد آن ها را فراموش مي كنند بايد اجتناب شود.نكات اساسي در تهيه و استاندارد كردن آزمون ها 8- توجه به كل محتوا در ساختن آزمون هاي پيشرفت تحصيلي، سازندگان آزمون اغلب بخش هايي از محتواي درس را مورد توجه قرار مي دهند كه ساختن پرسش هاي آزمون در مورد آن ها آسان تر است. بدين ترتيب، ممكن است بعضي از جنبه هاي موضوع مورد اندازه گيري ناديده گرفته شود. اما بايد دانست روايي آزمون بسته به اين است كه محتواي آزمون تمامي جنبه هاي مهم زمينه مورد اندازه گيري را شامل شود. آزموني كه سوال هاي آن همه زمينه هاي مهم را شامل نباشد فاقد روايي محتوايي است.روش اجراي آزمون هاي ميزان شده:آزمون هاي گروهي اجراي بعضي آزمون هاي گروهي با گذراندن يك دوره كوتاه كارآموزي ميسر است. اما اجراي بعضي ديگر از آزمون ها به مهارت و تجربه طولاني تري نياز دارد. معمولا اجراي آزمون هاي گروهي در مقايسه با آزمون هاي فردي با كارآموزي كوتاه تري امكان پذير است. آزنايش كننده بايد آزمايش را چنان ماهرانه و طبق دستورالعمل استاندارد شده برگزار كند كه به هر يك از افراد آزمايش شونده امكان داده شود تا حداكثر استعداد و توانايي خود را در پاسخ دادن به پرسش هاي آزمون نشان دهد. آزمايش كننده بايد قبلا در مورد محتواي آزمون، دستورالعمل اجراي آن و ساير شرايطي كه بايد رعايت شود آگاهي لازم را به دست آورد.اجراي آزمون هاي گروهي نكات مهم در اجراي آزمون هاي استاندارد شده :  شرايطي مشابه با شرايط تهيه و استاندازد آزمون براي كليه آزمايش شوندگان فراهم شود. رعايت كامل دستورالعمل آزمون كوشش در برقراري رابطه مطلوب بين آزمايش شونده و آزمايش كننده به منظور جلب اعتماد آنان(به ويژه در آزمون هاي فردي) گذرانده دوره هاي كارآموزي عملي(علاوه بر فراگيري دانش هاي نظري)اجراي آزمون هاي گروهي 1- شرايط اجراي آزمون: 1- ايجاد شرايط فيزيكي مناسب در جلسه آزمايش(از نظر نور، تهويه، درجه گرما، راحت بودن محل نشستن) نارسايي در هر يك از عواما مذكور موجب مي شود كه ميزان كارآيي آزمايش شوندگان كاهش يابد. اين مساله در مورد آزمون هاي سرعت بيش از آزمون هاي قدرت اثر نامطلوب بر جاي مي گذارد. 2- آزمون شوندگان به راحتي صداي مجري آزمون و راهنمايي هاي او را به راحتي بشنوند. 3- اتاق آزمايش از هر نوع عامل حواس پرتي مانند سر و صدا، تابلوهاي نقاشي، زنگ تلفن، آمد و رفت افراد و صحبت هاي مراقبان جلسه و هر عامل ديگري كه باعث عدم تمركز فكري و كاهش دقت آزمايش شوتدگان مي شود، به دور باشد.اجراي آزمون هاي گروهي 1- شرايط اجراي آزمون: 4- وضعيت روحي و جسمي آزمون شونده نتيجه آزمون را تحت تاثير قرار مي دهد. بنابراين، اجراي آزمون در مورد افراد خسته، عصباني، بي ميل، بيمارو غيره موجب مي شود كه نتيجه آزمون بيانگر نمونه اي از رفتارهاي واقعي آنان نباشد. 5- نحوه برخورد و رفتار آزمايش كننده و حالات روحي او( مانند خستگي،عصبانيت صداي نارسا) مي تواند تا حد زيادي نتيجه آزمون را تحت تاثير قرار دهد.اجراي آزمون هاي گروهي - اقدامات قبل از توزيع دفترچه آزمون: 1- پيش بيني لوازم مورد نياز 2- معرفي مجري و بيان هدف كلي از اجراي آزمون به زبان ساده 3- اجتناب از به كار بردن اصطلاحات فنياجراي آزمون هاي گروهي 3- اداره جلسه آزمايش و اجراي آزمون(وظيفه مجري) ايجاد شرايط استاندارد و همراه با احساس اطمينان براي انجام آزمايش برابر دستورالعمل آزمون در نظر گرفتن يك دستيار براي هر 15 تا 20  نفر آزمايش شونده در مورد آزمايش شوندگان خردسال مانند دانش آموزان دبستان يا دوره راهنمايي توضيحات لازم مطابق دستورالعمل آزمون توسط مجري داده مي شود. اگر آزمايش شونده اي از مجري آزمون سوالي بپرسد، او نبايد در دادن پاسخ مطلبي اضافه بر آن چه كه در دستورالعمل ذكر شده است، بيان كند. اگر به پاسخ هاي غلط نمره منفي تعلق نمي گيرد، اين امر به آزمون شوندگان اعلام شود تا اگر پاسخ سوالي را نمي دانند، بهترين پاسخ را حدس بزنند. كنترل وقت آغاز و پايان جلسه با كرونومتراجراي آزمون هاي گروهي نمره گذاري پاسخ نامه ها قبل از تصحيح و نمره گذاري پاسخ نامه ها با توجه به سه نكته زير مورد بررسي قرار گيرند. 1- نبايد بيش از يك گزينه به عنوان پاسخ صحيح انتخاب شده باشد. 2- براي مواردي كه پاسخ در محل مناسب قرار داده نشده، تصميم گيري شود. 3- در صورتي كه آزمودني از روي اشتباه، پاسخ سوال بعدي را در محل سوالي قبلي كه جواب ان را نمي دانسته علامت زده باشد، پاسخ نامه وي با در نظر گرفته اشتباه در جابه جايي پاسخ ها تصحيح شود. بعد از تعيين تعداد پاسخ هاي صحيح، غلط و سفيد نمره خام آزمودني با احتساب يا بدون احتساب نمره منفي محاسبه شود.اجراي آزمون هاي فردي نكات اساسي در اجراي آزمون هاي انفرادي 1- رعايت كامل دستورالعمل آزمون 2- ايجاد شرايط فيزيكي مطلوب در اتاق آزمايش 3- ايجاد همدلي با آزمودني 4- تكرار پرسش ها( به جز آزمون هاي حافظه) 5- مرتب كردن وسايل آزمايش 6- توجه  به حالات بدني آزمودني 7- كاوش پاسخ هاي مبهم آزمودني 8- مشاهده رفتار آزمودني 9- ارزشيابي پاسخ ها (با توجه به ملاك هاي دستورالعمل) 10- جلب اعتماد آزمودني خردسال 11- آزمايش آزمودني هاي داراي عقب ماندگي ذهني در بخش هاي زماني كوتاهعوامل موثر در نتايج آزمون ها 1- تاثير آزمايش كننده ( جنسيت، سن، نژاد، سطح مهارت، برخورد اجتماعي، پايگاه حرفه اي، و پايگاه اجتماعي- اقتصادي). پژوهش نشان داده است كه رابطه گرم يا سرد آزمايش كننده در نتايج آزمايش گروهي از آزمودني ها تفاوت معني دار ايجاد كرده است. 2- تجارب پيش از آزمايش آزمودني ها. مك كارتي گروهي از دانش آموزان دبستان را دو بار با تست آدمك مورد آزمايش قرار داد. بار اول آزمودني ها پيش از آمدن به جلسه آزمايش، انشايي در باره «بهترين تجارب زندگي خود» و بار دوم انشايي در باره «بدترين تجارب زندگي خود» نوشته بودند. در آزمايش دوم هوشبهر كودكان 4 الي 5 نمره كمتر از آزمايش اول بود. اين تفاوت ممكن است به سبب آشفتگي هاي هيجاني كودكان در مرتبه دوم باشد كه در آن انشايي در باره «بدترين تجارب زندگي خود» نوشته بودند.عوامل موثر در نتايج آزمون ها 3- تمرين ها و آمادگي قبلي آزمودني ها: آشنايي آزمودني ها با نمونه هايي از آزمون ها و تمرين هاي قبلي آنان مي تواند تا حدي در نتيجه آزمايش اثر بگذارد. دليل اين تمرين، يادآوري برخي از پاسخ ها، يادگيري راه حل ها و كسب بينش نسبت به مواد آزمايش بوده است. هم چنين كساني كه در پاشخ دادن به آزمو ن ها ي مختلف تجربه زيادي دارند، اين تجربه آمادگي بيشتري براي پاسخ دادن به آزمون ها در آنان بخ وجود مي آورد. علت اين امر غالبا اعتماد به نفسي است كه اين افراد نسبت به انجام آزمون ها پيدا مي كنن كه ضمن كاهش اضطراب آنان موقعيت بهتري را بريشان فراهم مي كند.مقياس سازي(Scaling)مقياس هاي درجه بندي رفتارهنجار يابي (Standardization) ص. 25 براهنياجرا و نمره گذاري آزمون اجرا و نمره گذاري آزمونتبديل و معادل سازي نمره هاي آزمونبيان نتايج آزمون آماري نيمرخ گنجي پيام نورتجزيه و تحليل نتايج آزموننيمرخ هاي رواني(Profile)