ویژگی های آزمون های کامپیوتری در مقایسه با آزمون های مداد- کاغذی


محمد حسین ضرغامی

چکیده:
هدف این پژوهش بررسی ویژگی های آزمون های مبتنی برکامپیوتر، مقایسه پذیری این آزمون ها با آزمون های مداد- کاغذی و از طرفی شناخت مزایا و محدودیت های سنجش کامپیوتری است. همچنین با توجه به تحقیقات انجام شده در زمینه ی آزمون های کامپیوتری، روش های پاسخگویی به سئوالات و شاخصه های روانشنجی به عنوان مو لفه های اساسی آزمون سازی، مطالعه شده اند.
 واژگان کلیدی: سنجش کامپیوتری ، آزمون های مبتنی بر کامپیوتر ، آزمون های مداد- کاغذی ، مقایسه پذیری ، شاخصه های روان سنجی . 

مقدمه:
عصر كشاورزي با هدف تهيه و تامين غذا به وقوع پيوست و تقريبا سي هزار سال دوام داشت. عصر صنعت پس از آن شكل گرفت و مشكل ابزار و مواد را كه نياز آن زمان بود برطرف نمود، در حدود 500 سال دوام داشت و در بعضي از كشورها همچنان ادامه دارد. موج سوم مربوط به عصر اطلاعات است كه با حضور كامپيوتر معرفي شده و به سرعت در حال توسعه و گسترش است و حوزه ي فن آوري و اطلاعات را شديدا تحت تاثير خود قرار داده است، هدف اين عصر رفع نياز اطلاعاتي بشر است (تافلر، 1368).
زندگي بشر امروزي در عصر اطلاعات به سوي دنياي مجازي يا موج چهارم حركت مي كند. نقشي كه كامپيوتر در اين دوران دارد، غير قابل انكار است. كامپيوتر ها به قسمت جدايي ناپذير زندگي مدرن تبديل شده اند، درحالي كه زماني نه چندان دور جزء اشياء اسرارآميز  و ناشناخته به شمار مي رفتند كه تنها در دانشگاهها و مراكز دولتي ديده مي شدند و براي استفاده ا ز آنها مهندساني با مدرك دكتري لازم بود (بوچر ، 1995). سرعت پردازش داده هاي كامپيوتري حتي از آنچه قانون مور  (1965) تعيين كرده بود فراتر رفته است و كمتر از دو سال دو برابر مي شود. كامپيوتر سايه ي قدرتمندش را بر همه ي عرصه هاي زندگي مدرن تحميل كرده است. يكي از حوزه هايي كه تحت تاثير فن آوري جديد و بخصوص كامپيوتر قرار گرفته، حوزه ي آموزش است. از آنجايي كه آموزش و پرورش هر عصر با توجه به مختصات و نيازهاي آن دوره تغيير مي كند، در جامعه اطلاعاتي امروز، شاهد توسعه دانشگاههاي مجازي، آموزش الكترونيكي، تجارب الكترنيكي، شهرها و سرويس هاي الكترونيكي متنوعي هستيم كه در حال توسعه اند. اين تحولات به همراه توسعه ي سريع دانش كه از طريق اينترنت به سرعت در حال گسترش است، زمينه ي رسيدن بشر به دنياي سه بعدي يا موج چهارم را فراهم كرده است (جلالی، 1383). در اين عصر آموزش بيشتر به سمت آموزش از راه دور  حركت مي كند. آموزش از راه دور حوزه ي وسيعي است كه شامل يادگيري مبتني بر كامپيوتر ، يادگيري آنلاين  و يادگيري الكترونيك  مي شود (احمدی، 1382).
در هزاران سال گذشته انسانها دور هم جمع مي شدند تا بياموزند و دانش خود را به ديگران منتقل كنند، اما فن آوري اطلاعات در زمان حال همه ي اين احتياجات را حذف كرده است و بزودي هر انساني در هر نقطه از دنيا و در هر زماني مي تواند بياموزد. اين اتفاقات به دليل حضور يادگيري الكترونيك است. يادگيري الكترونيك فن آوري كامپيوتر و شبكه را در جهت آموزش به خدمت مي گيرد. اين نوع يادگيري به استفاده از اطلاعات و تكنولو‍‍‍‍ژي كامپيوتري در جهت ايجاد تجارب آموزشي اطلاق مي شود (هورتن ، 2006).
گراس  كه مبدع واژه ي يادگيري الكترونيكي است، براي آن شش نشانه درنظر مي گيرد. اين نوع از يادگيري با جديد ترين اطلاعات همراه است و توسط اينترنت صورت مي گيرد، فراگير محور است، دربرگيرنده ي مجموعه اي از روشهاي آموزشي-  نظير كلاسهاي مجازي، همكاري ديجيتالي و شبيه سازي و غيره-  است، مبتني بر يادگيري به وسيله تلاش و كوشش توسط خود فراگير با بهره گيري از تكنولوژي جديد است، قابليت انجام فرايندهاي اداري و مديريتي- نظير ثبت نام ، تدريس، اجرا و ارزشيابي و سنجش- را به وسيله كامپيوتر فراهم مي آورد (آرگریسون، 1383).
در يادگيري الكترونيك كامپيوتر بر تمام مراحل فرايند آموزش تاثير می گذارد. يكي از اركان يادگيري الكترونيك سنجش، اندازه گيري و ارزشيابي فراگيران است. همانند آموزش سنتي در آموزش الکترونیک نيز آزمون ابزار اندازه گيري است. آزمونهايي كه از طريق كامپيوتر اجرا مي شوند، آزمونهاي مبتني بر كامپيوتر  يا آزمونهاي كامپيوتري   و فرايند سنجش، سنجش كامپيوتري  يا سنجش الكترونيك  ناميده مي شود. آزمونهاي مبتني بر كامپيوتر در سه شكل آزمونهاي ثابت چندگانه ، آزمونهاي انطباقی كامپيوتري12 و آزمونهاي چند مرحله اي13 اجرا مي شوند (لویکت14 ،2005).
اين آزمونها در سنجش گستره ي وسيعي از توانايي به بكار برده مي شوند و بنابراين مانند آزمونهاي سنتي براي تفسير نيازمند افراد متخصص مي باشند. انجمن روانشناسي آمريكا  (1986) جهت گيري هاي كلي آزمونهاي مبتني بر كامپيوتر و تفسير اين آزمونها را مشخص كرده است. معمولا اين آزمونها براي سنجش دانش، توانايي ها، مهارتها، شخصيت و نگرش ها بكار مي روند (واینر ، 2005).
آزمونهاي كامپيوتري
         كامپيوترها بر اجراي آزمونها تاثير زیادی داشته اند. يكي از مهمترين انتسابها به اين آزمونها، آزمونهاي انطباقي كامپيوتري  است. اين آزمونها بيشتر براي سنجش پيشرفت و نگرش منطبق شده اند و اغلب يك، دو يا سه مجموعه كوچك از سؤالات با درجه دشواري متوسط به آزمون دهندگان ارائه مي شود تا توانايي فرد تخمين زده شود. بر حسب اينكه آزمودني يا فراگير از لحاظ درستي چگونه به اين سوال پاسخ دهد، سوال بعدي به گونه اي مطرح مي شود كه بيشترين هماهنگي را با توانايي هاي فرد داشته باشد. بنابراين در صورتي كه فراگير به همه ي سؤالات داده شده اشتباه پاسخ دهد، سؤال بعدي آسانتر مطرح مي شود و اگر به همه ي سؤالات با موفقيت جواب داده باشد، سؤال يا سؤالات بعدي سخت تر طرح مي شوند. اگر به سؤالي درست پاسخ داده شود، يك سؤال با همان درجه ي دشواري بعنوان سؤال نشانگر  جايگزين مي شود. سؤال نشانگر، سؤالي است كه سطح توانايي فراگير را مشخص مي كند (کلاین ، 2005).
 
ماخذ: لویکت، 2005
بنابر اين در مقايسه با آزمونهاي سنتي كه براي همه ي آزمودني ها سؤالات يكسان وجود دارد، در آزمونهاي مبتني بر كامپيوتر هر آزمودني به سؤالاتي جواب مي دهد كه مطابق با سطح توانايي هايش باشد (کلاین،2005).
    به منظور استفاده از اين آزمونها بايد نكاتي را در نظر گرفت: در صورتي كه آزمونهاي كامپيوتري به منظور سنجش هاي پياپي و پيوسته (گزينش چرخشي ) استفاده شوند، بايد طول آزمون كوتاه و تعداد آزمودني ها بيش از 30 نفر باشند. محيط فيزيكي براي اجراي آزمون باید همانند آزمونهاي مداد- كاغذي  ساکت، راحت و عاري از عواملي باشد كه سبب حواس پرتي آزمون دهنده می شوند. در صورتی که آزمون های مبتنی بر کامپیوتر براي سنجش توانايي هاي شناختي به كار رفته باشند، بايستي سيستم نظارتي طراحي شود که در مقايسه با آزمونهاي سنتي نقش متفاوتي بر عهده دارد. اين آزمونها بدليل عدم حضور ناظر امتحاني در زمان اجرا، براي انواع مشخصي از سنجش مناسب اند. مثلا در سرند درخواست ها  مانند درخواست هاي شغلي يا شخصيت هاي ويژه، داده هاي زيستي  و سرند مهارتهاي مقدماتی  بهترين كارايي را دارند و در نهايت بايد فناوري  و حمايت كننده هاي نرم افزاري و سخت افزاري مورد نياز وجود داشته باشد (واینر، 2004).
سوالات معمول آزمونهاي مبتني بر كامپيوتر
وقتي آزمون گيرنده قصد دارد آزمون بگيرد يا به منظور بازخورد به فراگیران، نمرات را گزارش دهد بايد به هدف آزمون سازي توجه كند. مثلا اگر هدف آزمون اندازه گيري فرايند هايي است كه ياد گيرنده طي كرده است، آزمونها به صورت پاياني هر بخش گرفته و نمرات گزارش مي شوند. همچنین بازخورد به فراگيران به صورت عددي  و در پايان آزمون انجام مي شود، در حالي كه اگر هدف آزمون كمك به فراگيران در شناخت و اندازه گيري فرايند باشد، آزمونهاي كوتاه مكرر  استفاده مي شوند و نياز به گزارش نمرات وجود ندارد. در اين صورت بازخورد توصيفي  و عددي ارائه مي شود (آلران ، 1989).
بدليل ويژگي هاي كامپيوتر حيطه ي وسيعي از سوالات، در آزمونهاي كامپيوتري استفاده مي شود. سوالات صحيح/ غلط به منظور قضاوت درمورد درستي يا نادرستي يك گزاره بكار مي روند و تفاوت آن با آزمونهاي مداد- كاغذي وجود نمادهاي مختلف كامپیوتري براي نشان دادن علائم صحيح و غلط است. آزمونهاي چند گزينه اي (بيشتر از دو گزينه) كه در آنها تنها انتخاب يك گزينه مد نظر است و آزمونهاي چند ارزشي به راحتي با كامپيوتر قابل اجرا  و نمره گذاري و تفسير هستند. يك قانون کلي در انتخاب گزينه ها وجود دارد به اين ترتيب كه اگر گزينه ها به صورت مربع باشند، انتخاب بيش از يك گزينه امكان پذير است (در سوالات چند ارزشي) و در صورتي كه دايره اي شكل باشند، فقط و فقط يك گزينه می تواند انتخاب شود (در سوالاتي كه يك گزينه ي صحيح مد نظر است). از ديگر قابليت هاي كامپيوتر در مورد سوالات چند گزينه اي شخصي سازي نحوه ي نمايش گزينه هاست. گزينه ها مي توانند به صورت پشت سر هم ، زنجيره اي ، شبكه اي  و رشته اي  ، به دلخواه فراگير  نمايش داده شوند (هورتن، 2006). همچنين با كليك روي گزينه هاي تصويري مي توان گزينه ي مورد نظر را انتخاب كرد. مثلا ممكن است جدول تناوبي عناصر مندليف به صورت شكل نمايش داده شود و از فراگير خواسته شود تا پنج فلز را مشخص كند. اين عمل با كليك روي عناصر جدول امكان پذير است ونمره گذاري اش در مقايسه با آزمونهاي سنتي بسيار سريع و بلافاصله پس از جواب دادن صورت مي پذيرد. شكل ديگر سؤالات جاخالي ها هستند. برتري ويژه اين نوع سؤالات تعيين تعداد حروف مورد نياز براي تايپ كردن در جاي خالي است كه در آزمونهاي سنتي مداد- كاغذي امكان پذير نيست. مثلا اگر كلمه ي مورد نظر پنج حرفي است كامپيوتر به فراگير اجازه تايپ بيش پنج كلمه را نمي دهد.
آزمونهاي جوركردني  با كشيدن موس از يك ستون به ستون ديگر انجام می شوند. سؤالات ديگري وجود دارد كه از فراگير می خواهد اشياء و مواد مختلف آزمون را با توجه به نظم مشخصي كنار يكديگر قرار دهد. این نوع سئوالات با استفاده از آزمونهاي كامپيوتري به راحتي قابل اجرا و نمره گذاري اند. به اين ترتيب كه هر ماده ي آزمون به وسيله ي موس كامپيوتر كشيده و درجايگاه خودش قرار مي گيرد. با استفاده از كامپيوتر حتي آزمونهاي انشايي كوتاه پاسخ و تشريحي قابل اجرايند و مي توان تعداد كلمات مورد نیاز برای پاسخ را تعيين كرد. مثلا بيان مي شود 100 تا 150 كلمه در باره قانون سوم نيوتن بنويسيد؟ وقتي شمار كلمات از 150 عبوركند، امكان تايپ وجود ندارد (هورتن، 2006).
برنامه هاي مختلف كامپيوتري امكانات زيادي در اختيار كاربر قرار مي دهد و دست آزمون ساز را در طراحي سؤالات آزمون باز مي گذارد. به عنوان مثال وجود اشكال مختلف و قابليت كشيدن مواد آزمودني مي تواند در طرح سوالاتي كه سطح تركيب شناختي را مي سنجد، بكار رود. همچنین در سؤالاتي كه نياز است فراگير كلمه اي را از يك متن به عنوان پاسخ انتخاب كند عامل حدس به حداقل ممكن مي رسد، چرا كه تمام كلمات متن قابليت كليك شدن را دارند (هورتن، 2006).
شاخصه هاي روانسنجي آزمونهاي مبتني بر كامپيوتر
شاخصه هاي روانسنجي كه براي آزمونهاي انطباقي مانند آزمونهاي مبتني بر كامپيوتر بايد مورد تحقيق قرار گيرند عبارتند از: روايي ، پايايي ، نرم پذيري ، انطباق پذیری10، و پذيرش آزمودني11. روايي و پايايي در مورد همه ي آزمونها بدست مي آيند، اما بدليل ماهيت آزمونهاي انطباقي و خصوصا آزمونهاي كامپيوتري بايد نرم پذيري، همتا بودن اين آزمونها با آزمونهاي سنتي و همچنين درجه ي پذيرش اين آزمونها از ديد آزمودني ها مورد مطالعه قرار گيرد تا بتوان به آنها اعتماد كرد.
روايي آزمونهاي مبتني بر كامپيوتر
روايي در آزمونهاي كامپيوتري، مهارتها، توانايي ها و ويژگي هايي را در نظردارد که نبايد به وسيله ي سيستم آزمونگیري (كامپيوتر) تحت تاثير قرار گيرند (واینر، 2004).
بن-پوراس  و بوچر در سال 1995 آزمون انطباقي MMPI-2 را برگزار كردند. در اين آزمون انطباقي سه شكل مختلف از آزمون MMPI در اختيار آزمودني ها قرار گرفت. يك سري از آزمونها به صورت دفترچه  و دو سري ديگر به صورت آزمون استاندارد  MMPIو آزمون انطباقي كامپيوتري بود . اين تحقيق روي 571 دانشجوي دوره ي ليسانس رشته ي روانشناسي برگزار شد. دانشجويان به سه قسمت تقسيم شدند و به هر گروه يكي از آزمونها داده شد. نتايج نشان داد كه از لحاظ آماري تفاوت معنا داري بين قالب هاي آزمون كامپيوتري و آزمون دفترچه اي وجود ندارد. بعضي از تحقيقاتي كه در باره ي روايي آزمونهاي شناختي و غير شناختي انجام شده است، در جدول1 ديده می شود. در اين تحقيقات همبستگی بين آزمون های مبتنی بر کامپيوتر و آزمون های مداد کاغذی در سنجش يک موضوع واحد نشان داده شده است.
جدول 1: همبستگی آزمون های کامپیوتری و مداد- کاغذی  در حیطه های شناختی و غیر شناختی
تحقیق    ضریب همبستگی    نوع آزمون
مید  و دراسگو  (1993)    97/.    توان عقلی
گیبسون  و واینر (1997)    98/    شناخت پيوندی
کاندلر7 (2003)    97/   
واینر وسایرین8 (a 2003)    1   
واینر وسایرین (b 2003)    95/   
مید و دراسگو (1993)    72/    سرعت شناختی9
گیبسون و واینر (1997)    86/   
کاندلر (2003)    90/   
واینر و سایرین (a 2003)    87/   
واینر و سایرین (b 2003)    85/   
فینگر  و وانز  (1999)    1تا 92/    شخصيت

تحقيقات نشان می دهد روایی آزمون های مبتنی بر کامپيوتر از آزمون های مداد – کاغذی بيشتر است. مخصوصا در مديريت داده ها خيلی صحيح تر و کار امد تر عمل می کنند (فینگر، 1999).
نرم پذیری و انطباق پذیری آزمون های کامپیوتری
نرم پذيری آزمون های مبتنی بر کامپيوتر به معنی توزيع های مناسب اين آزمون ها است که بايد نمايانگر ويژگی های مطلوبی باشد. اين ويژگی ها شامل ميانگين، پراکندگی و شکل نمرات می شوند (واینر، 2004). يکسانی آزمون های مبتنی بر کامپيوتر و آزمون های مداد- کاغذی که تحت عنوان همتا پذيری  مورد تحقيق قرار می گيرند بر مقايسه پذيری  آزمون های مداد کاغذی و آزمون های مبتنی بر کامپيوتر اشاره دارد. آزمون های مبتنی بر کامپيوتر اگر با دقت ساخته شده باشند انتظار می رود که همسانی سازه داده باشند. واينر (b2003) در مطالعه ای به بررسی همتا پذيری آزمون های مداد- کاغذی و کامپيوتری پرداخته است. اين مطالعه روی 424 داوطلب انجام شد که شامل آزمون های توانايی شناختی زماندار بود. اين آزمون ها از 12 خرده آزمون توانایی کلامی، استدلال و مهارت های عددی و مهارتهای حسی تشکیل شده بودند. طرح تحقيق اندازه گيری مکرر بود که در مرحله ی اول آزمون مبتنی بر کامپيوتر، در مرحله ی دوم آزمون مداد-کاغذی و در آخرين مرحله آزمون های مداد-کاغذی و کامپيوتر با هم برگزار شدند. هبستگی بین آنها 98/ و توزیع نمرات آنها قابل انطباق بود. جدول 2 نرم پذيری برای خرده آزمون حل مساله را با مقايسه ی ميانگين، واريانس و ضريب همبستگی بين آزمون کامپيوتری و مداد کاغذی نشان می دهد:
جدول 2: تفاوت میانگین ها، واریانس ها و ضریب همبستگی آزمون حل مساله کامپیوتری و مداد- کاغذی
 تفاوتها   
حل مساله
 ضریب همبستگی    واريانس    ميانگين    تعداد آزمون   
96/    54/4    87/    188   




پذيرش آزمودنی ها
تجارب نشان مي دهد كه آزمودني ها عموما علاقمند به آزمونهاي مبتني بر كامپيوتر هستند (مک لید ، 2002). در تحقيقي پیمایشی  که واينر (a 2003) روي 310 دانشجو انجام داد پرسش نامه هايي بعد از برگزاري آزمون در اختيار آزمودني ها قرار گرفت. نتايج حاصل از اين تحقيق به شرح زير است:
تجارب آزمونهاي مبتني بر كامپيوتر معقول و قابل پذيرش مي باشند (78 درصد موافق، 5       درصد مخالف و 18 درصد ممتنع) 51 درصد آزمودني ها اجراي آزمون از طريق كامپيوتر را در آزمون هاي با حساسيت بالا ترجيح مي دهند و 34 درصد، آزمون هاي مداد كاغذي را مناسب دانسته اند. همچنین 65 درصد آزمون هاي كامپيوتري را عادلانه دانسته اند.
تبديل پذيري روشهاي سنتي و آزمون هاي كامپيوتري
محققان مطالعات زيادي درباره ي تبديل پذيري روشهاي سنجش كامپيوتري و روشهاي آزمون گيري سنتي مطرح كرده اند. بعنوان مثال هوفر  و گرين (1985) به شرايط متفاوت آزمون هاي مبتني بر كامپيوترنسبت به آزمون هاي مداد كاغذي اشاره كرده اند و نشان دادند كه اين آزمون ها با يكديگر قابل مقايسه نيستند در حالي كه بسياري از محققين معتقدند اين آزمون ها قابل تبديل به يكديگر هستند و مي توان آنها را به جاي يكديگر استفاده كرد.
تبديل پذيري آزمون زبان انگليسي تافل
از سال 1964 تا 1998 آزمون تافل تنها به صورت كتبي(مداد كاغذي) برگزار مي شد و آزمودني ها به سئوالات در پاسخنامه جواب مي دادند. در سال 1998، ETS يا سرويس آزمون سازي آموزشي كه ارائه دهنده آزمون تافل مي باشد به همراه سيستم يادگيري سيلوان  كه آزمون هاي مبتني بركامپيوتر را ارئه مي دهد، تصميم گرفتند تا آزمون تافل را به وسيله كامپيوتر اجرا كنند. بنابراين از سال 1998 به بعد اجراي آزمون تافل به صورت كامپيوتري در كنار آزمون مداد كاغذي در سراسر جهان برگزار مي شود. ارائه آزمون به صورت كامپيوتري با آزمونهاي مداد- كاغذي تفاوت دارد. مثلا از آنجا كه در آزمونهاي كامپيوتري آزمودني قادر است به وسيله هدفن به سؤالات يا متن گوش دهد، بنابراين براي افراد نابينا و كم شنوا مي تواند بخوبي به كار رود. همچنين برقراري رابطه ي تعاملي و دوسويه و امكان گفتگو و مكالمه ي انگليسي براي آزمودني ها به كمك نرم افزارها امكان پذير است (ماتیزن ، 2007).


مقايسه ي سرند روانپزشكي  و مصاحبه هاي باليني
تحقيقاتي وجود دارد كه نشان مي دهد مصاحبه هاي باليني با سرند كامپيوتري انطباق پذيرند. اين تحقيقات نشان داده اند كه مراجعين در بيان اطلاعات شخصي و خصوصي زندگي شان با كامپيوتر در مقايسه با زماني كه روانشناس مستقيما حضور دارد احساس راحتي و اطمينان خاطر بيشتري دارند (هایل  و ادکینز ، 1997). علاوه بر اين تحقيقات نشان داده است كه برنامه هاي سنجش كامپيوتري در تشخيص مشكلات رفتاري موفق بوده اند. روس و همکاران  از فهرست مصاحبه تشخيصي كامپيوتري  (C-DIS) به همراه DSM-III-R در كلينيك هاي باليني براي تشخيص 173 مراجع استفاده كردند. درجه ي توافق بين دو روش اجرا شده بجز در تشخيص اختلالات سوء مصرف مواد و شخصيت ضد اجتماعي قابل قبول بود و مصاحبه ي تشخيص كامپيوتري (C-DIS) با احتمال 90 درصد اختلالات گروه نمونه را بدرستي تشخيص داد.
مقايسه پرسشنامه¬ي كامپيوتري با پرسشنامه هاي استاندارد
در مورد مقايسه پذيري  پرسشنامه هاي كامپيوتري با پرسشنامه هاي استاندارد تحقيقات وسيعي انجام شده است. ویلسون ، جملکا  و دیگر همکارانشان آزمون نگرش را روي 98 دانشجوي زن، به دو صورت مداد- كاغذي و كامپيوتري اجرا كردند. با متعادل كردن دو شيوه ي اجرا نشان دادند، ميانگين و واريانس هاي بدست آمده از این دو شيوه مقايسه پذيرند. هلدن  و هيكمن  (1987) دو قالب كامپيوتري و مداد كاغذي از مقياس فعاليت جنكينز  تهيه كردند. اين مقياس به منظور تشخيص افراد با تيپ شخصيتي A بكار برده مي شود. در اين مطالعه در هر شكل ‌آزمون 60 نفر شركت كردند. نتايج بدست آمده بيانگر مقايسه پذيری واريانس ها، ميانگين ها، پايايي آزمون ها و روايي سازه ي آنها بود. مرتين  و راش  (1996) روش هلدن وهيكمن را در مورد پرسشنامه شخصيتي آيزنگ و مقياس رتبه بندي كارل  در افسردگي اجرا كردند. نيمي از شركت كنندگان به فرم های كامپيوتري اين پرسشنامه ها و نيمي ديگر به پرسشنامه هاي استاندارد پاسخ دادند. ميانگين ها و انحراف استاندارد اين دو شيوه اجرا مقايسه پذیر بودند.
در يك ارزشيابي پيچيده تر جملكا، والکر  و تروپین  (1992) آزمون مبتني بر كامپيوتر را روي 100 نفر از جانيان تبهكار در زندان اجرا كردند. اين آزمون ها شامل: خلاصه اي از سلامت رواني، مصاحبه هاي تاريخي شخصي، شكل گروهي آزمون MMPI، آزمون تجديد نظر شده هوشبهر بتا ، مقياس احتمال خودكشي ، سياهه خشونت طلبي بوس دوركي  و آزمون سرند الکلیسم وتران  بودند. با استفاده از نتايج اين آزمونها چارت طراحي شد كه با آن خشونت طلبي، سوء مصرف مواد، خودكشي و تمايل بالقوه به قرباني شدن را رتبه بندي مي¬كرد. همراه اين آزمونها تشخيص باليني از طریق DSM-III-R نیزانجام شد و جانيان در موارد ذکر شده رتبه بندي شدند. بين اين دو شيوه ي رتبه بندي توافق قابل قبولي (82%) وجود داشت.
تحقيقاتي كه در مورد مقايسه پذيري سنجشهاي سنتي و كامپيوتري شخصيت انجام شده اند بيشتر با MMPI و MMPI2 صورت پذيرفته است (اسکیول برگ ، 1988). اين تحقيقات نشان داده اند كه تفاوت بين دو شيوه ي اجراي آزمون ناچيز و همبستگي بين آنها از 68 درصد تا 98 درصد است (واتسون و سایرین ، 1990). حتي در بعضي از تحقات همبستگي خيلي بالاتر (92 تا97 درصد) گزارش شده است (سوکی¬گارا ، 1996). همچنین در تحقيقي فرا تحليلی (فینگر و وانز، 1999)  14 مورد از مطالعاتي كه روي آزمونهاي انطباقی MMPI و MMPI2 در طي سالهاي 1974 تا 1996 اجرا شده بودند، بررسی کردند و نشان دادند كه بين نمره هاي T تفاوت ناچيزي وجود دارد و همبستگي بين آزمونهاي سنتي و كامپيوتري MMPI و MMPI2  در حدود يك بوده است. بر اساس اين تحقيقات محققان معتقدند كه فرمهاي كامپيوتري و مداد كاغذي (دفترچه اي) آزمون MMPI قابل مقايسه اند. با اين وجود هناكر  (1988) معتقد است كه تحليل هاي آماري نمي تواند دليلي بر تبديل پذيري آزمونهاي مداد- كاغذي و آزمونهاي كاميپوتري باشد.
تبديل پذيري آزمونهاي عصبي- رواني كامپيوتري   با آزمونهاي عصبي- رواني استاندارد.
 محققين روی آزمونهاي انطباقي كامپيوتري عصبي- رواني مطالعه كرده اند. پلگرینو و همکاران  (1987) مجموعه اي شامل 10 آزمون كامپيوتري از توانايي هاي فضايي را با آزمونهاي مداد كاغذي آن مقايسه كردند. نتايج نشان داد كه بكار بردن آزمونهاي كامپيوتري در توانايي هاي فضايي مي تواند جايگزين آزمونهاي استاندارد مداد- كاغذي آن شود. همچنین کوکا  و موریس  (1992) آزمون مبتني بر كامپيوتر طبقه بندي شده ي هالستيد را با آزمون اصلي هالستيد مقايسه كردند. اين دو آزمون روي گروهي از افراد با نقایص عصبي رواني اجرا شد. گزارش آنها نشان مي دهد كه آزمون مبتني بر كامپيوتر با آزمون استاندارد هالستيد قابل مقايسه اند. در عين حال تحقيقاتي وجود دارد كه نتايج آنها گيج كننده است، مثلا فرنچ  و بیومونت  (1990) از اختلاف معناداري بين شكلهاي كامپيوتري و آزمونهاي استاندارد ماتريس هاي پيشرونده خبر دادند و نتیجه گرفتند که آنها را نمي توان به جاي يكديگر استفاده كرد.
مقايسه پذيري روشهاي گزينش كامپيوتري با گزينش سنتي
تحقيقاتي وجود دارد كه روشهاي سنجش كامپيوتري را با رويكرد سنتي گزينش كاركنان مقايسه كرده اند. کارتا  (1989) فوايد آزمونهاي كامپيوتري گزينش كاركنان را بررسي كرد. اين آزمونها به صورت آزمايشي در گزينش و طبقه بندي نيروي هوايي ايالات متحده استفاده شد. 478 نفر از افسران در اين آزمون كه به دو صورت مداد- كاغذي و كامپيوتري اجرا شد، شركت كردند. نتايج برآمده از اين تحقيق نشان داد كه آزمونهاي كامپيوتري به طور شايسته اي شاخص هاي پرواز را اندازه مي گيرند و از روایی كاملي برخوردار اند. آزمونهاي مبتني بر كامپيوتر در انتخاب كاركنان چه در بخش هاي خصوصي و چه در بخشهاي عمومي موفقيت آميز عمل كرده اند. واينر (2004) ويژگيهاي برنامه ها ي موفق كامپيوتري را در گزينش كاركنان بر مي شمارد. اين نكات اشاره به وجود طراحي زير بنايي تكنولوژي دارد كه بايد در طراحي سرعت، قدرت، حفاظت و مديريت داده ها مد نظر قرار گيرند.
مزايا و محدوديت هاي آزمونهاي مبتنی بر كامپيوتر
مزايا و محدوديت هاي آزمونهاي مبتني بر كامپيوتر در مقايسه با آزمونهاي سنتي مداد- كاغذي مطرح مي شوند. این مزايا و محدوديت منجر به بحث ها فراوان و افراطي شده است و بیشتر آنها پیرامون طريقه اي است كه سيستم آموزشي ساخته مي شود. آزمونهاي مبتني بر كامپيوتر به طور غير مستقيم از آزمونهاي مداد كاغذي سنتي انتقاد مي كنند، به عنوان مثال سيستم هاي آموزشي كه ارزیابي از فراگیران را بر اساس آزمونهاي كامپيوتري انجام مي دهند به فراگيران اجازه مي دهند كه بعد از فراگيري سر فصل دروس به سرعت وارد مرحله ي بعدي آموزشي شوند و مانند آزمونهاي سنتي نياز به سپري شدن زمان خاصي نيست. اين عمل سبب افزايش انگيزه ي فراگيران جوان مي شود و در نتیجه آنها متمايل به استفاده از اين نظامهاي آموزشي می¬شوند (اتول ، 2005).

مزاياي آزمونهاي مبتني بر كامپيوتر
اجراي كامپيوتري آزمونها در دستيابي به جواب سوالات مراجعين روانشناسان باليني يكي از موارد پر كاربرد آزمونهاي مبتني بر كامپيوتر است. اين شكل سؤالات مزاياي زيادي نسبت به روش هاي سنتي در روانشناسي باليني دارد. مهمترين اين فوايد عبارتند از: صرفه جويي بالقوه در زمان، حذف امكان اشتباه در پر كردن برگه ي سؤالات، حذف اشتباه متخصصان باليني و تكنيسين ها در نمره گذاري دستي برگه هاي مراجعين و حذف سوگيري در دست نوشته هاي مراجعين. در اين نوع آزمون گيري به دليل تايپ جواب ها سوگيري نسبت به دست خط مراجعين از ميان برداشته مي شود (آندروود ، 2006).
انعطاف پذیری
انعطاف پذيري  آزمون گيري كامپيوتري بدليل قدرت طراحي آنها است که به آزمون سازان اجازه مي دهد با در اختيار داشتن گروهي از متخصصان برنامه نويسي، قبل از اجراي آزمون براي جوابهاي احتمالي مراجعین چارت هايي تهيه كنند. مثلا اگر از مراجع پرسيده مي شود: "آيا شما ازدواج كرده ايد؟" با توجه به جواب بلي يا خير آزمودني يك سلسله سوالات مربوط به پاسخ آزمودني از او پرسيده شود. اين عمل علاوه بر رسيدن به جوابهاي نهايي  و مد نظر آزمون گيرنده به عنوان يك مصاحبه ي ساختارمند نيز مورد استفاده قرار مي گيرد (تامسون ، 2006). به عبارت ديگر اجراي آزمون با توجه به ويژگي هاي مراجع تغيير مي كند و منطبق بر آن ويژگي ها مي شود و اين يكي از مهمترين برتري هاي آزمونها و مصاحبه هاي كامپيوتري است (آندروود ، 2006). بنابراين يكي از نتايج مهم و باارزش آزمونهاي كامپيوتري اين است كه براي تشخيص سطح توانايي آزمودنی ها به سؤالات كمتري نسبت به آزمونهاي سنتي نياز است و در وقت و هزینه صرفه جویی می شود. همچنين سطح توانايي آزمودني يا فراگير با دقت بسيار بيشتري نسبت به آزمونهاي سنتي تعيين مي شود، چرا كه تعداد سؤالات مربوط به سطح توانايي فرد بيشتر است. اين در حالي است كه در آزمونهاي سنتي تمام سؤالات از آسانترين تا مشكل ترين براي تمام افراد مطرح مي شود. در ضمن بر خلاف آزمون های کامپیوتری براي تعيين شاخصه هاي روانسنجي آزمونهاي سنتي به هزاران نفر احتياج است تا به شاخص هاي پايا  برسند. بنابراين جاي تعجب نيست كه بسياري از مؤسسات آزمون سازي به گسترش آزمونهاي مبتني بر كامپيوتر روي آورده اند (کلاین، 2005).
يكي ديگر از قابليت هاي آزمونهاي مبتني بر كامپيوتر پيدا كردن یک لغت در ميان يك متن است، به فراگير اين امكان داده مي شود تا هر كدام از لغات متن را بتواند انتخاب كند، چرا كه تمام لغات قابل كليك شدن هستند. اگر چه در آزمونهاي مداد- كاغذي آزمودني می تواند با نشانه گذاری لغت مورد نظر اين عمل را انجام دهد اما برای تصحيح بایدوقت زیادی صرف شود، حال آنکه در آزمون های کامپيوتری به محض کليک کردن نتيجه ی عملکرد آزمودنی در اختيار می باشد (ماتیزن،2007).
بازخورد تکوینی  سریع
بازخورد تشخيصی (تکوينی) خودکار از ديگر قابليت های آزمون های کامپيوتری است. اين آزمون ها به سادگی فرصتی را برای فراگيران ايجاد می کند تا بازخوردی فوری از کار خود داشته باشند. همچنین برای افراد با برخی ناتوانايی ها انطباق پذيرند. يک طرح آموزشی برای امتحانات تشخيصی و تکوينی در دانشگاه منچستر روی 240 دانش آموز ناتوان  در دروس بيوشيمی  و بيولوژی  انجام شد. نتيجه ی اين تحقيق نشان می دهد سنجش کامپيوتری فوايد بيشتری نسبت به روشهای سنتی دارد. مثلا قابليت درشت شدن خطوط برای افراد کم بينا ، تغيير رنگ و پس زمينه ی نوشته ها ، افزايش  و کاهش صدا از ديگر توانايی های آزمون های مبتنی بر کامپيوتر است (ماتیزن، 2007) . آزمون های کامپيوتری از نوع آزمون های تکاملی هستند که ابزار ارزشمندی در جذب فراگيران بشمار می روند. افرادی که از آزمون های سنتی روی گردانند، از اين نوع آزمون ها استقبال می کنند. بنابراین سنجش های الکترونيکی کسالت موجود در آزمون های تکوینی سنتی را از بين می برند. در اين آزمون ها هر سن و هر شخصيتی می تواند شرکت کند. از طرف ديگر در صورت برگزاری آزمون به صورت آنلاين هر فرد در هر نقطه از دنيا و در هر زمانی می تواند به آزمون دسترسی پيدا کند. به طور کلی سنجش الکترونيک در برابر آزمون های مداد کاغذی تجربه ای غنی تر، جذاب تر و با روايی بالقوه بالا تری است (بوچر، 2003). بهتر است در امتحانات حساس به منظور استفاده از انگيزه های بالقوه ی افراد از سنجش الکترونيکی استفاده شود. سهولت در تکرار اجرای آزمون به فراگيران اجازه می دهد تا امتحانات شان را با توجه به برنامه ی کاری خود و در وقت مناسب انتخاب کنند و مانند آزمون های رسمی سنتی مقرر به زمان و مکان مخصوص نيستند. در صورتی که فرد به هر دليلی نتواند در امتحانات شرکت کند، می تواند در نوبت های بعدی که امتحان برگزار می شود، شرکت کند.
اطلاعات اضافی
آزمون های کامپيوتری اطلاعات اضافی  در اختيار معلمان قرار می دهند. مثلا چون زمان پاسخ گويی به سؤالات برای هر آزمون به طور جداگانه مشخص است و به درستی لحاظ می شود ، معلمان می توانند به آسانی آزمون های قدرت– سرعت را برگزار کنند. بدليل این امکانات روانشناسان شناختی علاقمند به استفاده از اين آزمون ها هستند. ايجاد فرصت برای ملاحظات عملی يک فرايند فکری در طول امتحان و عواملی مانند تأثير مرور کردن سؤالات و اتخاذ استراتژی های بکار رفته توسط آزمودنی ها، مد نظر روان شناسان شناختی است.، که در آزمون های مداد- کاغذی بررسی اين فرايندها امکان پذير نيست (کلاین، 2005). مجموعه داده ها ی اضافی که از آزمون های کامپيوتری بدست می آيند اين قدرت را دارند تا شيوه ی آزمون گيری را به دو طريق مهم بهبود بخشند. اول، زماني که اطلاعات اضافی به عنوان اطلاعات ثانوی و فرعی مد نظرند. فايده عملی اين است که، فرصتی برای اصلاح تخمين مدلهای موجود فراهم می آورد و اين در حالی است که دستيابی به يک نمونه بزرگتر غير ممکن است. دوم اينکه اطلاعات اضافی ممکن است به اصلاح مفهوم سازی نظری  بيانجامد. به طور کلی توانايی آزمون های مبتنی بر کامپيوتر در رمز گردانی ، نمايش و نمره گذاری آزمون ها و انجام کارهای ترکيبی پويا  سبب شده است تا به صورت قسمت مرکزی فرايند سنجش و اندازه گيری قرار گيرند (استیلس ، 1991 ).
سلامت  و تصحیح آزمون ها
سلامت و حفاظت از آزمون های مداد کاغذی در جريان چاپ ، حمل و نقل و ذخيره کاری مشکل و هزينه بردار است. در صورتی که در آزمون های کامپيوتری اين عوامل حذف می شوند و بنابراين در نيروی انسانی و مالي صرفه جويی می شود، از طرفی اطمينان از سلامت آزمون بالا می رود. در آزمون های مداد کاغذی حتی آزمون های چند گزينه ای که با سرعت بيشتری نسبت به ساير آزمون های مداد کاغذی نمره گذاری می شوند، وقتی تعداد فراگيران زياد باشد وقت و هزینه ی زيادی برای تصحيح لازم است. در حالی که در آزمون های مبتنی بر کامپيوتر نمره گذاری بلافاصله و پس از اتمام آزمون صورت می پذيرد و فراگيران می توانند از نتیجه عمل خود مطلع شوند و برای ادامه کار خود برنامه ريزی داشته باشند (استیلس، 1991). اين مورد درباره ی آزمون های با حساسيت بالا- مانند کنکور سراسری- نقش برجسته تری دارد.
به طور خلاصه مزايای شنجش الکترونيکی عبارت اند از:
•    توانايی ارائه آزمون بر اساس نياز در زمان مناسب برای آزمون ها.
•    اين آزمون ها از طريق اينترنت در تمام نقاط دنيا به سرعت قابل اجرا هستند.
•    زمان اجرا و نمره گذاری آزمون ها به شدت کاهش می يابد و نياز به گزارش رسمی وجود ندارد.
•    بازخورد تشخيصی فوری از توانايی های آزمودنی ها.
•    کار آمدی .
•    سرعت بالا در اجرا، تصحیح و نمره گزاری سبب افزایش قدرت تصمیم گیری می شود.
•    امنيت: احتمال گم شدن مواد يا دفتر چه ها، قبل از آزمون ، زمان آزمون و يا بعد از آزمون کاهش پیدا می کند.
•    انعطاف پذيری: آزمون با ويژگی های آزمونی منطبق می شود.
•    عملکرد يکپارچه : قدرت يکپارچه سازی اطلاعات بدست آمده از آزمون را دارا است.
•    آزمون به بهترين شکل استفاده و تفسير می شود (واینر، 2004).
محدوديت های آزمون های مبتنی بر کامپيوتر
 انتظار می رود در سالهای بعد امتحانات بيشتر از طريق کامپيوتر برگزار شود. دلايل مهم زيادی برای برگزاری آزمون ها از طريق کامپيوتر وجود دارد و اين محرک های قدرتمند به زودی موجب گسترش سنجش الکتريکی در سراسر جهان می شوند. با وجود اين محدوديت ها و مشکلاتی در کاربرد آزمون های مبتنی بر کامپيوتر وجود دارد.
تامین هزینه
بيشتر نوآوری هايی در عرصه ی سنجش کامپيوتری انجام می شود در مؤسساتی است که بودجه گسترش ابزار و سيستم های آن از محل هزينه های تحقيقاتی تأمين می شود و اجازه ی استفاده از اين بودجه به چند بخش محدود می باشد در حالی که به منظور بکار گيری هر چه بيشتر سنجش الکترونيکی به پشتوانه ی اقتصاد و مديريتی قوی نياز است. سنجش الکترونيک اگر چه برای اهداف تکوينی درون مؤسسات به آسانی به کار گرفته می شود، اما به منظور گسترش بکارگيری وسيع نياز به يک برنامه ی بادوام فنی و آموزش دانشگاهی احساس می شود. تجربه نشان داده است که کار های خلاقانه ای مانند گذراندنIT نيازمند رويکرد مشارکتی بين دانشگاه و مؤسسات ملی و دانشگاه و مدارس است تا زمينه ی قدرتمندی برای گسترش سنجش الکترونيکی فراهم شود (تامسون، 2006). همچنين در اين صورت نياز به واحد حمايت کننده ی مرکزی وجود دارد. در صورتی که سنجش الکترونيکی در آزمون های که از نظر حساسيت متوسط به بالاهستند بکار گرفته شود بايستی گروهی از متخصصان روايی آنها را بررسی کنند و در مرحله ی بعد بايد بانک سؤالات تهيه شود. از طرفی چون این نوع سنجش قابليت تعاملات دو طرفه را دارايند، لازم است سيستم هايی طراحی شود که این قابليت را داشته باشد. ايجاد چنين توليدات گران و پيچيده برای رشد سنجش کامپيوتری مانع جدی دولت ها به حساب می رود و در بیشتر کشورها هنوز اقدامات اساسی یا صورت نپذیرفته و یا با رویکرد اقتصادی انجام شده است. به عنوان مثال در قسمت های آموزشی کشور انگلستان سيستم های مطمئنی، با اهداف اقتصادی ايجاد شده است (اتول، 2005).


محافظه کاری
محافظه کاری خلق عمومی غالبی است که اجازه نمی دهد سيستم های رسمی امتحانی خلاقيت به خرج دهند. تنها در کشور اسکاتلند بدليل يکپارچه سازی سنجش الکترونيکی و آموزش الکترونيکی شکل متفاوتی از سنجش ارائه شده است و مؤسسات ارائه دهنده از بودجه ی مرکزی دولت تحت حمايت قرار می گيرند (آندروود، 2006).
به این دلیل که نگاه و حساسیت نسبت به آزمون در بين آزمودنی ها تغيير می کند، برای سازندگان آزمون های کامپيوتری و همچنين شرکت کنندگان در اين امتحانات مشکلاتی بوجود می آید. به عنوان نمونه از آنجا که سؤالات با يک دستورالعمل ارائه نمی شود، می تواند به گمراه شدن آزمودنی ها در ادامه ی مسير بياجامد. انتقادی که به طور مستمر از طرح های آزمون سازی مبتنی بر کامپیوتر ارائه می شود ناتوانی در جهش از يک سؤال به سؤال ديگر و همچنين تغيير پاسخ ها است، چرا که در آزمون های کامپيوتری انتخاب يک سؤال برای فراگير بر اساس پاسخ های او به تمام سؤالات قبلی است (لویکت، 2005). بعضی از افراد ممکن است در استفاده از کامپيوتر راحت نباشند و يا اينکه مهارت لازم را نداشته باشند، اگر چه انجام يک آزمون کامپيوتری با توانایی حرکت دادن موس صورت می گيرد (هورتن، 2006)، ولی به دليل تغيير رويه، عمل آزمون گيری با کامپيوتر متفاوت از روشهای سنتی است . علاوه بر این ماهیت آزمون و محتوی سؤلات (به عنوان مثال وقتی درباره ی مسائل شخصی افراد سؤال پرسيده می شود) روی کاهش يا افزايش انگيزه ی افراد در پاسخگويی به سؤالات تأثير می گذارد. چنين وضعيت هايی ممکن است به نتايج متفاوتی نسبت به قالب سنتی آزمون گيری منجر شود.
تحلیل سئوالات
يکی ديگر از مشکلات استفاده از کامپيوتر در سنجش اين است که تحليل های کامپيوتری بيشتر به صورت عمومی اند و نتايج آزمون های کامپيوتری، ممکن است نادرست بکار روند. اين نتايج به این خاطر که بر آمده از کامپيوتر اند، عملی تر به نظر می رسند.
نتیجه گیری
امروزه کامپیوتر ها در حیطه ی وسیعی از روند آزمون سازی بکار می روند و با توجه به تحقیقات انجام شده می¬توان دریافت که نقش کامپیوترها در اجرا، نمره گذاری و تفسیر آزمون های روانشناختی مهم و در حال افزایش است. احتمالا کامپیوترها بهترین رابط در اجرای آزمون ها هستند. فواید آزمون های کامپیوتری سبب شده است تا سنجش سنتی به سمت سنجش کامپیوتری سوق داده شود. از آنجا که  عموما آزمون های کامپیوتری و آزمون های انطباقی کامپیوتری با آزمون های مداد- کاغذی موازی  اند (کوین  و کارلس ، 1994)، و آزمون های کامپیوتری وضعیت مطلوب تری را ایجاد می¬کنند، بکارگیری این آزمون ها معقولانه و به صرفه تر می باشد. به خصوص در زمان تصحیح و تفسیر آزمون ها به شدت صرفه جویی می شود (مورفی ، 1987).
اگر چه نحوه ی اجرای آزمون های کامپیوتری در مقایسه با آزمون های مداد- کاغذی متفاوات است، اما بسیاری از تحقیقات انجام شده در مورد مقایسه پذیری این دو روش اجرا، نشان می دهند که شاخصه های روانسنجی آنها به هم نزدیک اند. از طرفی به دلیل قابلیت های اختصاصی آزمون های کامپیوتری سنجش شناختی با کمک این آزمون ها در تمام سطوح شناختی امکان پذیر است. این در حالی است که محدودیت هایی از قبیل هزینه ی بالای سیستم های کامپیوتری و ناآشنایی کاربران بخصوص در کشورهای غیر پیشرفته سبب شده است که در این کشورها صرفا از آزمون های مداد- کاغذی استفاده شود.
سرانجام این که کامپیوتری شدن در دهه های اخیر امکان بسیاری از پیشرفت های فنی در زمینه ی ادبیات روانسنجی  را ایجاد کرده است. کامپیوترها علاوه بر گسترش نظریه ی سئوال پاسخ  که راهی به سرچشمه ی اصلی روان آزمایی در تعلیم و تربیت ، صنعت و روان شناسی بالینی است، به عنوان ابزاری مهم در خدمت متخصصین سنجش و اندازه گیری قرار گرفته اند (کوین و کارلس، 1994).

منابع
آرگریسون، دی. آر، اندرسون، تری. (1383). یادگیری الکترونیکی در قرن 21. ترجمه ی محمد عطاران. تهران: انتشارات مدارس هوشمند.
احمدی، حسین، ویرجینیاری، ماری. (1382). آموزش الکترونیکی. تهران: مرکز آموزش و تحقیقات صنعتی ایران.
تافلر، الوین. (1980). موج سوم، ترجمه شهپندخت خوارزمی (1368)، تهران: نشر نو.
جلالی، اکبر. (1383). عصر مجازی: چهارمین موج گوگل، نشریه: فرهیختگان، شماره مسلسل 491.
American Psychological Association. (1986). Guidelines for computer-      based tests and interpretations. Washington, DC: Author.
Attewell, J.(2005). "Mobile technologies and learning."                                www.lsda.org.uk/files/pdf/041923RS.pdf      
Butcher,J. (2003). Handbook of psychology: assessment psychology. Vol    10. Newjersy: Johan Wily and  sons Inc      
Butcher, J. N. (1987). Computerized psychological assessment. New       York: Basic Books.         
Butcher, J. N. (1995). "User’s guide for the MMPI-2 Minnesota                  Report: Personnel system." Minneapolis, MN: National                             computer systems.
Caretta, T.R. (1986). "USAF pilot selection and classification                       systems". Aviation, Space, and environmental Medicine, 60, 46- 49.   
Chandler Macklead (2002). Unpublished research: "Equivalence of             paper pencil and web- based (C-M) versions of basic skills and                 aptitude tests".  
Kline, T. (2005). Psychological testing: a practical approach to                   design and evaluation. Thousand Oaks, SAGA publications.
Finger, M.S.,& Ones, D.S. (1999)."Psychometric equivalence of the             computer and booklet forms of the MMPI: A meta analysis".                     Psychology Assessment, 11,58-66.
French, C.C., & Beaumont, J.G. (1990). "A clinical study of the                      automated assessment of intelligence by the Mill Hill                                 Vocabulary Test and the Standard Progressive Matrices Test".                   Journal of Clinical Psychology, 46, 129-140 
Gibson, W.M, & Weiner, J.A. (1997). "Equivalence of computer-                  based and paper- pencil cognitive ability tests". Paper presented                at the twelfth annual conference of the society for       Industrial and         organizational psychology, ST. Louis.         
Holden, R. R.,& Hickman, D. (1987). "Computerized versus                         standard administration of the Jenkins Activity Survey". (form T).           Journal of Human Stress, 13, 175-179.
Horton, W. (2006). E-learning by design. Pfeiffer, An imprint by WILY.  
Hofer, P. J., & Green, B.F. (1985). "The challenge of competence                and creativity in computerized psychological testing".   
   Journal of consulting and clinical psychology, 53, 826-838.
Honaker, L.M.,Harell, T.H.,& Buffaloe, J.D. (1988). "Equivalence   of        Microsoft computer MMPI administration for standard and                        specials scales". Computers of Human Behavior, 4,323-337.
 
Hile, M. G., & Adkins, R. E. (1997)." Do substance abuse and                        mental health clients prefer automated assessment?" Behavior                  Research     Methods, Instruments, and computers, 29, 146-150.   
 Jemelka, R. P., Wiegand, G. A., Walker, E. A.,& Trupin, E.W. (1992).       "Computerized offender assessment: validation study".                              Psychological Assessment, 4, 138-144.          
Kevin, R.M.,& Charles, O. D., (1994). Psychological testing: Principles     and applications. New Jersey: Prentice Hall.    
Luecht, R.M. (2005). Some useful cost- benefit criteria for                           evaluation computer-based test delivery models and systems                      encyclopedia of statistics in behavioral science. Londen: Wily.   
Matthiesen, Steven J. (2007). Essential words for the TOEFL . تهران: قلمستان هنر  
Mead, a., & Drasgow, F. (1993). "Equivalence of computerized and             paper- pencil cognitive ability tests: A meta- analysis".                             Psychological Assessment, Vol 11, No.1, 58-66   

Mertin, t.,& Ruch, W. (1996). "A comparison of computerized and                conventional administration of the German versions of the                         Eysenck Personality Questionnaire and the Carroll Rating
    Scale for depression". Personality and Industrial Differences, 20,             281-    291.
Murphy, K.R. (1987). "Accuracy of clinical vs. computerized test                  interpretations". American Psychologist, 42, 192- 193.
Pellegrino, J.W., Hunt, E.B., Abate, R.,& Faret, S. (1987). "A                       computer- based test battery for the assessment of statistic
   and dynamic spatial reasoning abilities". Behavior Research                      Methods, Instruments, and computers,19, 231- 236.               
Ross. H. E., Swingson, R., Larkin, E.J., & Doumanni, S. (1994).               "   Diagnosing comorbidity in substance abusers: computer                            assessment and clinical validation" . Journal of nervous and mental          disease, 182, 556-563.               
Schuldberg, D. (1988). "The MMPI is less sensitive to the                               automated testing format then it is to represented testing:   
      Item and scale effects". Computer and Human Behaviors, 4, 285-             294.
Sukigara, M. (1996). "Equivalence between computer- based and
    booklet administrations of the new Japanese version of the      MMPI".      Educational and Psychological Measurement, 56, 570- 584.        
Styles, I. (1991). "Clinical assessment and computerized testing".
    International Journal of Man- Machine Studies, 35, 133-       150     
Thomson (2006). "Acceptance and usage of e-assessment for UK                 awarding bodies ،"Www.tinyurl.com/yl2jfu.     
Underwood, J.(2006). "Digital technologies and dishonesty in                      examinations and tests", qca.org.uk/lw12.html    
Weiner, J. A.(2003). Equivalence of computer- based and paper-                 pencil employee Aptitude survey (EAS) forms. Glendale, CA:  PSI
Weiner, J. A.(2003). Equivalence of computer- based and paper-                   pencil basic skill tests (BST) forms. Glendale, CA: PSI.
Weiner, J. A.(2004)."Web- based assessment: Issues and            
   Applications in personnel selection". IPMMAC 28th annual conference     on personnel assessment.      
Wilson, F.R., Genco, K.T., & Yager, G.G. (1985). "Assessing the                evaluation of paper and pencil vs. computerized tests:           
   Demonstration of a promising methodology". Computers        in human     behavior, 1, 265-275.
Washington, C. G., Juba, M., Anderson, P.E.,& Manifold,V.        
    (1990). "What does the keane et al. PTSD scale for the MMPI                    measure?" Journal of the Clinical Psychology, 46,600,606.