اندازه‌گيري و مقياس گذاري



آيا علم بدون اندازه‌گيري معني دارند؟ علوم اجتماعي بدون اندازه‌گيري چه خواهند بود؟ اندازه‌گيري اجتماعي نشأت گرفته از يك جريان پر ثمر به نام رويكرد تحليلي تجربي است. آمار و روش تحقيق در اندازه‌گيري نقش مركزي و بنيادي دارند و تعيين اين كه چه زماني آنها وارد حوزه‌اي علوم اجتماعي شده‌اند مشكل است. زير مجموعه‌اي مهمي از اندازه‌گيري‌هاي اجتماعي كميّت سازي رفتار انساني است. به منظور كمّي‌سازي رفتار انساني از ابزار انساني از ابزارهاي اندازه‌گيري استفاده مي‌شود. آزمون‌هاي روانشناسي و تربيتي جزء ابزار غالب‌اند و كاربرد تاريخي دارند. به عنوان مثال آزمون هوش در اوايل قرن بيستم در فرانسه و در آموزش و پرورش توسط بنيه و سيمون بكار گرفته شد. در حقيقت مي‌توان آنها را پيشگامان اندازه‌گيري اجتماعي در مقياس وسيع دانست.



به منظور سنجش اجتماعي و اجراي آزمون‌هاي روانشناسي و تربيتي مخصوصاً در مقياس‌هاي وسيع چه چيزي لازم است؟ اولين ويژگي مهم ابزار اندازه‌گيري روايي و پايايي آن است. علاوه بر اين‌ها ضروريات ديگري نيز مورد نياز است.



در نظريه‌ي كلاسيك اندازه‌گيري نمره‌ي آزمون تركيبي از نمره‌ي واقعي فرد و نمره‌ي خطاي اندازه‌گيري است. امكان تعريف خطاي اندازه‌گيري به روشهاي مختلف و به منظور تعميم به ديگر موقعيت‌هاي سنجشي وجود دارد. تئوري تعميم‌پذيري در سال 1963 توسط كرونباخ و همكارانش توسعه يافت. اين تئوري براي حل مساله‌ي تعميم بوجود آمده است. در اين نظريه چهارچوبي ارائه مي‌شود كه نحوه‌ي برخورد با جوانب مختلف نمره‌ي آزمون مشخص مي‌شود. بعد از آن نظريه سؤال پاسخ گسترش يافت. در اين نظريه واحد تحليل به جاي محل آزمون تك‌تك سؤالات است. در اين نظريه واريانس خطا تابعي از سطحي توانايي پاسخ دهنده مي‌باشد و اين ويژگي است كه در بيشتر مدلهاي نظريه كلاسيك اندازه‌گيري وجود ندارد.



بنابراين IRT به اصلاح كاربردهاي نظري آزمون منجر مي‌شود. علاوه بر آن باعث پديدآيي كاربردهاي جديدي مانند آزمون‌هاي انطباقي كامپيوتري مي‌شود.



كتاب‌ها و مراجع در زمينه‌ي تئوري‌هاي رواني در نظريه‌ كلاسيك عبارتند از: گاليسن 1950 و لرد و نويك 1968. همچنين در نظريه تعميم‌پذيري مي‌توان به لي كرونباخ (مانند كرونباخ، گلستر، ناتدا و راحبارتنام، 1972) رجوع كرد.



در علوم رفتاري به طور عموم و روانشناسي و تعليم و تربيت به طور اخص روش‌هاي متفاوت اندازه‌گيري و سنجش وجود دارند. ابزار اندازه‌گيري جزو لاينفك اندازه‌گيري است و مهمترين آنها در حوزه‌هاي علوم رفتاري آزمون‌هاي روانشناسي و تربيتي، آزمون‌هاي هوش، نگرش، پيشرفت، شخصيت، پرسشنامه‌هاي رغبت‌سنج، روشهاي رفتاري و آزمون‌هاي عصبي – روانشناختي مي‌باشند. اين آزمون‌ها محدود به علوم رفتاري نيستند و گاهي در روانپزشكي نيز بكار مي‌روند. استفاده از روش‌هاي اندازه‌گيري و همچنين تئوري‌هاي آماري به منظور مدل سازي نمرات حاصل نتايج اين روش‌ها مي‌باشند.



علاوه بر اينكه اندازه‌گيري و سنجش امروز جزء زندگي روزمره است يك زيربناي اساسي بررسي‌هاي علمي است. بعد از تعريف مفاهيم اندازه‌گيري، مقياس‌هاي اندازه‌گيري و رابطه‌ي آن با آمار مشخص خواهد شد.



تعريف آزمون



يكي از بهترين تعاريف آزمون بيان مي‌كند كه آزمون «روش استانداردي است براي اندازه‌گيري رفتار از طريق نمرات و يا طبقات مختلف». اين تعريف ضرورتاً اندازه‌گيري نظام‌دار را در بر مي‌گيرد. فهرست وارسي، مقياس‌هاي رتبه‌اي و طرح مشاهده مشمول اين تعريف مي‌شوند. بعضي از ويژگي‌هاي آزمون عبارتند از:



- روش‌استاندارد به اين معني است كه روش اجرا براي همه‌ي آزمودني‌هاي يك گروه يكسان و همانند است.



- براي اندازه‌گيري بايد يك نمونه رفتاري محدود و متمركز شده مد نظر باشد يعني آزمون بر روي يك حوزه‌ي رفتاري كه به طور مناسب تعريف شده است تمركز داشته باشد. به عنوان مثال در حوزه‌ي اندازه‌گيري‌هاي تربيتي پيشرفت در صاحب يا عملكرد زبان مي‌تواند مد نظر باشد. آزمون‌هاي روانشناسي ممكن است سازه‌ها و متغيرهاي نظري (مانند افسردگي، برون‌گرايي، كيفيت زندگي، تهييج‌پذيري و مانند اين‌ها) را هدف قرار دهند. اين سازه‌ها و متغيرها به طور مستقيم قابل مشاهده نيستند. در اينجا متغير مورد اندازه‌گيري يك عنصر اساسي در شبكه‌اي منطقي و در ارتباط با مشاهدات قرار مي‌‌گيرد.



- متغير مورد اندازه‌گيري از طريق نمرات و يا طبقات مختلف توصيف مي‌شود. استفاده از آزمون‌ها شكلي از اندازه‌گيري است كه به موجب آن عملكردها، خصوصيات و صفات به كمك اعداد و يا طبقات مختلف نشان داده مي‌شود.



علاوه بر اين وقتي نمره‌ يك آزمون مربوط به يك فرد در دسترس است، نرم‌ها يا استانداردهاي گروه مربوط به آن نيز به منظور تفسير نمره‌ي او لازم و ضروري است. نهايت اين كه گرد‌آوري نمرات آزمون به ندرت به تنهايي يك هدف است.



عملكرد سنجش يا نمونه‌گيري در نهايت منجر به تصميم‌گيري درباره‌ي يك مفهوم مي‌شود و بنابراين طبقه‌بندي، گزينش و جايدهي، تشخيص و طرح‌ريزي درمان، خودآگاهي، ارزشيابي برنامه و تحقيق را در بر مي‌گيرد.



استيونس اندازه‌گيري را به صورت زير تعريف مي‌كند: «اختصاص اعداد به وجوه اشياء يا وقايع با توجه به يك قانون و يا با توجه به يك عرف مشخص» تعاريف گستره‌تر و شسته رفته‌تري از اندازه‌گيري وجود دارد ولي براي هدف ما تعريف استيونس مناسب است.



معمولاً يك آزمون از تعدادي سؤال تشكيل شده است و ساده‌ترين شكل آن زماني است كه سؤال به صورت دو ارزش (صحيح و غلط) باشد.



بعد از اين كه يك آزمون روي يك گروه از افراد اجرا مي‌‌شود. ما براي هر فرد يك نمره داريم. ساده‌ترين مثال از يك نمره آزمون جمع نمرات يك آزمون چند گزينه‌اي است كه در آن به هر سؤال درست يك نمره داده مي‌شود و به سؤالات غلط يا جا افتاده هيچ نمره‌اي تعلق نمي‌گيرد. در اجراي اين آزمون‌ها ما بعضي از افراد نمره‌ي بالاتري نيست به بقيه مي‌گيرند و بنابراين انتظار داريم اين تفاوت مربوط به آن فرد باشد.



ما زماني از اندازه‌گيري صحبت مي‌كنيم كه يك نمره محاسبه شده باشد. اندازه‌گيري به يك صفت يا يك جنبه آزمودني برمي‌گردد. طبقه‌بندي مشهور مقياس‌هاي اندازه‌گيري توسط استيونس 1951 بيان شده است اين مقياس‌ها عبارتند از:



مقياس اسمي، رتبه‌اي، فاصله‌اي و نسبي  يا نسبتي، بيشتر محققين در بحث اندازه‌گيري از مقياس اسمي استفاده نمي‌كنند. يك مقياس بايد حداقل بتواند درباره‌ي مقدار يك ويژگي در يك سؤال چيزي را بيان كند. بسياري از محققين حتي خودشان را ملزم به استفاده از حيطه‌ي محدود‌تري از مقياس‌ها مي‌كنند و بيان مي‌كنند كه يك مقياس اندازه‌گيري حداقل بايد ويژگي فاصله‌اي را داشته باشد.



يك مثال از مقياس فاصله‌اي درجات سيليسيوس و فارنهايت در اندازه‌گيري حرارت (گرما) است. اين مقياس‌ها از طريق انتقال خطي روبرو به هم تبديل مي‌شوند: F=(9/5) C+ 32 . در اينجا انتقال پذيرفتني است و با انتقال خطي ويژگي‌هاي فاصله‌اي مقياس حفظ مي‌شود. زماني كه ما يك مقياس نسبتي داريم انتقال خطي امكانپذير نيست چون چنين انتقالي مستلزم تغيير مبدأ (صفر مطلق) مي‌باشد. در اين مقياس تنها ضرب در يك مقدار ثابت مجاز است. به عنوان مثال مي‌توان در اندازه‌گيري طول از سانتي‌متر به جاي متر استفاده كرد. وقتي مقياس مورد اندازه‌گيري، رتبه‌اي است همه‌ي انتقالات افزايش يكنواخت مجاز مي‌باشند.



هنگامي كه يك فرد مي‌خواهد اندازه‌هاي مربوط به ويژگي‌هاي توزيع را به دست آورد و يا از آزمون‌هاي آماري استفاده كند، بايد خصوصيات مربوط به مقياس مورد اندازه‌گيري را بداند. وقتي از مقياس رتبه‌اي استفاده مي‌شود برآورد ميانگين مد نظر نيست بلكه شاخص ميانه مناسب‌تر و منطبق‌تر با مقياس به نظر مي‌رسد. به كار بردن آمار به تنهايي در اندازه‌گيري يك متغير مورد نظر نيست. زماني كه آزمون‌ آماري استفاده مي‌كنيم بايد بررسي كنيم و ببينيم آيا مفروضات توزيع حفظ مي‌شود يا نه. گاهي اوقات ممكن است مفروضات به طور كامل رعايت نشوند ولي در صورتي كه انحراف از آنها خيلي جدي نباشد مي‌توان از آزمون‌ آماري استفاده كرد.



تفسير نتايج يك آزمون آماري وابسته به مفروضه‌هاي سطح اندازه‌گيري آن است و در بعضي از موارد يك انتقال غير خطي ممكن است ترتيب و رتبه‌‌ي دو ميانگين را معكوس كند. بنابراين ما بايد تصميم بگيريم كه كدام انتقال را بكار مي‌بريم.