ضریب آلفا و روشهاي برگرفته از مدل معادلات à ساختاري د ر برآورد اعتبار
ضریب آلفا و روشهاي برگرفته از مدل معادلات
à ساختاري د ر برآورد اعتبار
A Comparison between Alpha Coefficient and Structural Equation
Modeling Methods to Estimation of Reliabilityà
àà مسعود کبیري
Masoud Kabiri,*
چکیده
هدف این مطالعه، مقایسه بین ضریب آلفا و
روشهاي برگرفته از مدل معادلات ساختاري در
برآورد اعتبار آزمون است. انطباق با مدل اندازه گیري
اساساً معادل-تاو و عدم همبستگی بین خطاهاي
اندازهگیري مهمترین پی شفرض هاي ضریب آلفا
است. در مقابل، روشهاي برگرفته از مدل معادلات
ساختاري علاوه بر عدم الزام در رعایت چنین
پیشفرضهایی امکان بررسی و آزمون هریک از
آنها و قابلیت وزنبندي گویهها جهت تشکیل
ترکیب بهینه براي تشکیل مقیاس را نیز بهدست
میدهد. در این مقاله چهار روش برآورد اعتبار در
روشهاي مجذور » مدل معادلات ساختاري، شامل
استفاده از ،« اعتبار مرکب » ،« همبستگی چندگانه
مورد بحث « اعتبار بیشینهاي » و « متغیرهاي خیالی »
قرار گرفت. هر یک از این روش ها بر روي داده هاي
حاصل از مقیاس ادراك نسبت به نگرش معلم
ریاضی از مجموعه مقیاسهاي نگرش نسبت به
ریاضی فنما و شرمن بهکار برده شد. دادههاي این
مقیاس از نمونه 340 نفري دانشآموزان سال اول
متوسطه بهدست آمد. نتایج کاربرد هر یک از این
روشهاي برگرفته از مدل معادلات ساختاري نشان
دادکه روشهاي معرفی شده مقادیر بالاتري از اعتبار
مقیاس نسبت به ضریب آلفا را نشان میدهند. کاهش
ضریب آلفا ممکن است به علت عدم انطباق مقیاس
با مدل اساساً معادل-تاو باشد. به طو ر کلی بحث
پیشینهاي بههمراه نتایج مطالعه نشان داد که رو ش
هاي برگرفته از مدل معادلات ساختاري برآوردهاي
دقیقتري براي اندازهگیري اعتبار آزمون هستند.
Abstract
The purpose of this study is comparison
between alpha coefficient and given methods of
structural equation modeling to estimate
reliability of a scale. Due to necessity of
restricted assumptions, that is, fitting to
essentially τ-equivalence measurement model
and uncorrelated measurement errors. Alpha
coefficient may be an inaccurate estimator, In
contrast, methods of structural equation
modeling does not require considering this
assumptions, also there are some possibilities to
test assumptions and weighting items to
construct an optimal scale. In this article, we
discuss four estimators of reliability in structural
equation modeling: square multiple coefficient,
composite reliability, phantom variable and
maximal reliability. Each of them was analyzed
on perception of math teacher' attitude scale- a
scale of Modified Fennema and Sherman's
mathematics attitude scales. Data gathered from
340 ninth grad students. The results reveal these
methods have higher values of reliability scale
rather than alpha. The reduction of alpha may be
due to miss-fit of scale to essentially τ-
equivalent model. In general, the results of this
study along with literature review show that
given methods of structural equation modeling
are more accurate estimators to measurement of
reliability.
Keywords: alpha coefficient, reliability,
structural equation modeling,estimate reliability,
square multiple coefficient, composite phantom
variable, maximal reliability, phantom variable,
maximal reliability.
کلیدواژهها: مدل معادلات ساختاري، ضریب
آلفا، اعتبار مرکب، اعتبار بیشینهاي، متغیر خیالی،
مجذور همبستگی چندگان
1388/6/ 1387 تصویب نهایی : 1 /3/ دریافت مقاله : 4 à
پژوهشگاه مطالعات وزارت آموزش و پرورش àà
à Rresearch Institute for Education of Education ministry, I,R.Iran
*Eٍmail: mkabiri@rie, ir, Tel: (+98)21 88 95 2003, 09102123787
40 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 40
مقدمه
به عنوان رابطه واریانس واقعی به واریانس « اعتبار » ، در نظریۀ کلاسیک آزمون
مشاهده شده (رایکوف، 2004 ) و ضریب اعتبار به عنوان سهم واریانس نمره مشاهده
شدهاي که توسط واریانس نمره واقعی تبیین می شو د (گراهام، 2006 ) درنظر گرفته
میشود. بر این اساس ضریب اعتبار به عنوان شاخص کلی دقت اندازه گیر ي ملاحظه
می شود (رایکوف، 2004 ) که در نقطۀ مقابل خطاي اندازه گیر ي است . علاو ه براین،
را به عنوان تجانس نمرات یا ثبات درونی نیز تعریف نمود (آناستازي، « اعتبار » می توان
1379 ). این تعریف که یکی از رایج ترین مبانی محاسبات اعتبار را تشکیل میدهد، بر
روش ب هدست آوردن اعتبار بر اساس یکبار اجراي آزمون استوار است که در مقابل
سایر روشهاي محاسبۀ اعتبار مثل بازآزمایی و فرمهاي همتا قرار دارد. معرو فترین
روش محاسبه اعتبار در این مبنا، ضریب آلفا است که توسط کرونباخ پیشنهاد شده
است. بحث این مقاله بر روي این روش از محاسبه اعتبار متمرکز شده است.
بررسی پیشینه پژوهشی نشان میدهد که ضریب آلفا داراي پیشفرضهاي مهم و
جدي است که عدم توجه به آن ها میتواند بر برآورد اعتبار اثر داشته باشد. این
١ گویه ها و عدم همبستگی بین « بودن (τ) معادل-تا و » پیشفرضها شامل اساساً
؛ خطاهاي اندازهگیري گویه ها میباشند (بیکون، سائور و یونگ، 1995 ؛ رایکوف ، 2001
2004 ؛ رایکوف و شراوت، 2002 ؛ کوماروف، 1997 ؛ گراهام، 2006 ؛ گرین و هرشبرگر،
2000 ). اساساً معادل-تاو بودن گویهها به یکسانی نمرات مشاهده شدة گویه ها یا
تساوي بار گویهها مرتبط است. عدم رعایت این پیشفرضباعث می شود که آلفا داراي
اعتبار کمتري باشد. به این دلیل در برخی مواقع اعتبار به عنوان مرز پائین اعتبار شناخته
.( میشود (رایکوف و شراوت، 2002 ؛ گراهام، 2006
و یا اندازه گیر ي در مقیاس یکسان) ) « معادل-تاو بودن گوی هه ا » براي بررسی
می توان انحراف معیار گویه ها را ملاحظه نمود. در صورتیکه انحراف معیار نمرات
گویههاي تشکیل دهندة یک آزمون از یکدیگر تفاوت زیادي داشته باشند، میتوان
چنین نتیجهگیري کرد که این گویهها احتمالاً در مقیاس متفاوتی اندازهگیري می شون د،
در غیر اینصورت، وجود مقیاس یکسان محتمل است. چنین بررسی میتواند توسط
41 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 41
ایجاد فواصل اطمینان پیرامون انحراف معیار انجام شود. به ای نصورت که با ایجاد
فواصل اطمینان حدود انحراف معیار، میتوان معادل بودن آنها را از نظر دیداري
بررسی کرد (گراهام، 2006 ). با این حال، رعایت نکات دیگر ي م یتواند اطمینان از
معادل-تاو بودن گویهها را حاصل کند. بهطور مثال، در صورتیکه از اشکال متفاوتی
براي دریافت پاسخ استفاده کنیم، احتمال معادل-تاو نبودن گویه ها زیاد خواهد بود
(گراهام، 2006 ). به عبارت دیگر، اگر در مقیاسی هم گویههاي صحیح و غلط و هم
گویههاي 5 درجهاي طیف لیکرت وجود داشته باشد، احتمالاً نمی توان این گویه ها را
گویههایی معادل دانست. وزنبندي یکسان گویه ها نیز از عوامل بهدست آوردن
گویههاي معادل-تا و است (بیکون، سائور و یونگ، 1995 ). در بیشتر مطالعات،
گویههاي آزمون با وزن یکسانی با همدیگر ترکیب می شوند . اگر گویه ها وزنهاي
یکسانی براي ترکیب و ایجاد یک متغیر ترکیبی نداشته باشند، احتمالاً مقیاس معادل-تاو
را نخواهیم داشت. از عوامل دیگري که بر معادل-تا و بودن اثر میگذارد، تعداد
٢ ضریب آلفا در آزمونهایی که تعداد « ک م برآورده شدن » ، گویههاست. به طوري که
گویههاي بیشتري دارند، کمتر اتفاق میافتد (گراهام، 2006 ). به این دلیل که با معاد ل-
تاو نبودن یک گویه مقدار کمی از سهم واریانس نمره واقعی تغییر می کن د و بنابراین
کم تر در معادل-تاو بودن مقیاس تأثیر می گذا رد. از طرف دیگر، در مقیاس هاي
کوچک تر، معادل-تاو نبودن یک گویه سهم بیشتري بر معادل-تاو بودن مقیاس دارد. با
اینحال، نتایج برخی از مطالعات نشان میدهد که وجود حتی یک گویه غیر معادل-تاو
میتواند بر دقت ضریب آلفا موثر باشد (رایکوف، 1997 ). با وجود اهمیت این نکات
هیچ روش دقیق و مشخصی بر اساس روشهاي مرسوم اندازه گیر ي براي بررسی
معادل-تاو بودن گویهها وجود ندارد.
٤« متجانس » ٣، معادل-تاو، اساساً معادل-تاو و « مدل موازي » بهطور کلی چهار نوع
وجود دارند که بسته به مفاهیم و عناصر محدود شده آن تعریف میگردند.
محدود ترین مدل اندازهگیري در تعریف نمرات واقعی است. در « مدل موازي » ¨
این مدل علاوه بر آن که همه گویههاي آزمون متغیر نهفتۀ یکسانی را میسنجند (مفهوم
تکوجهی بودن که در تمام آزمون هاي ثبات درونی فرض میشود)، فرضمیشود که
همه گویههاي آزمون دقیقاً معادل یکدیگر هستند. علاوهبرآن، همه گویه ها باید متغیر
42 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 42
نهفته را در مقیاس مشابهی اندازهگیري کرده که با درجه یکسانی از دقت و مقدار
یکسانی از خطا همراه باشند (گراهام، 2006 ). به عبارت دیگر، مقیاس اندازه گیر ي،
دقت و خطاي اندازهگیري همه گویهها یکسان در نظر گرفته می شود . این مطلب را
میتوان با استفاده از معادلهاي ریاضی آن به ترتیب به این صورت نشان داد:
(1) bi= … = bk = ۱
(2) ai=…= ak = ۰
(3) Var (E i) =…= Var (Ek)
ضریب بین متغیرهاي مشاهده و متغیر نهفته (بارهاي عاملی)، bi در این عبارت ها
(4) Ti = aij + bij Tj ضریب ثابت درمعادله ai واریانس خطاي اندازهگیري، و Var (Ei)
.( را نشان میدهد (رایکوف، 1997 Tj و Ti است. این معادله رابطه خطی بین نمرات
دارد به جز آنکه در این « مدل موازي » نیز ساختاري همانند « مدل معادل- تاو » ¨
مدل، خطاهاي واریانس گویهها میتوانند از همدیگر متفاوت باشند. این موضوع دلالت
بر این دارد که تکتک گویهها، متغیر نهفته یکسانی را در مقیاس یکسان و با درجه
دقت یکسانی اندازهگیري می کنند ولی احتمالاً میزان خطاي متفاوتی وجود دارد
1998 ؛ گراهام، 2006 ). معناي مفهومی این مدل آن است که اگرچه همه a ، (رایکوف
نمرات واقعیِ گویهها معادل هستند ولی هر گویه عبارتهاي خطاي منحصر به فردي
( دارد. بر حسب عبارات ریاضی پیشین میتوان گفت که در مدل معادل- تاو عبارت ( 3
درنظر گرفته نمیشود.
فرضمیکند که هر گویه، متغیر نهفته یکسانی را در « مدل اساساً معادل- تاو » ¨
یک مقیاس یکسان ولی با دقت احتمالاً متفاوتی اندازهگیري میکند. علاوهبراین، در این
مدل همانند مدل معادل-تاو احتمالاً خطاهاي اندازهگیري نیز متفاوت هستند (رایکوف،
1997 ). در این تعریف تفاوت بین دقت و مقیاس گویه برجسته شده است. در مدل
معادل- تاو فرض میشود که نمرات واقعی گویهها معادل هستند، ولی در مدل اساساً
معادل- تاو نمره واقعی گویه میتواند توسط ترکیب با یک ضریب یگانه اضافی به هر
زوج از متغیر ها متفاوت باشد. این پیشفرضبهشکل ریاضی اینگونه نوشته میشود:
(۵) Xik = (αk + Ti) + Eik
43 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 43
عبارت فوق این حقیقت را منعکس میکند که اگرچه نمرات واقعی گویهها در
مقیاس یکسانی اندازهگیري میشوند (یعنی واریانس مشابهی دارند)، ولی ممکن است
دقت متفاوتی (میانگینهاي متفاوت) داشته باشند. گنجانیدن ضریب اضافی تنها بر
میانگین گویهها تأثیر میگذارد، ولی بر واریانس و کوواریانس آنها متفاوت نیست
(گراهام، 2006 ). بر حسب عبارتهاي مشخص شده در مدل موازي، میتوان مدلی را
دانست که عبارت هاي ( 2) و ( 3) را رعایت نکرده باشد. براي « مدل اساساً معاول-تاو »
استفاده از ضریب آلفاي کرونباخ لازم است که اندازهگیري حداقل بر مبناي مدل اساساً
معادل-تاو استوار شده باشد. به این معنا که مقیاس و نمرات واقعی گویه ها یکسان
باشد.
در نهایت کمترین محدودیت در آن وجود دارد و به همین دلیل « مدل متجانس » ¨
است. در این مدل فرضمیشود که « اعتبار » عمومی ترین مدل براي استفاده در برآورد
تک تک گویهها متغیر نهفته یکسانی را با مقیاس، دقت و میزان خطاي احتمالاً متفاوت
مدل » اندازهگیري میکنند (آدامسون، شولین، لوید و لوئیس، 2000 ؛ گراهام، 2006 ). در
مدل اساساً » در این است که در « مدل با مدل اساساً معادل-تاو » تفاوت این « متجانس
٥با همدیگر متفاوت « جم عپذیر ي » نمرات واقعی گویهها توسط ضریب « معادل-تاو
هستند، در حالیکه در مدل متجانس بین نمرات واقعی گویهها رابطه خطی فرض شده
و بین هر زوج از آن ها، ضریب جم عپذیر یگانهاي وجود دارد که میتوان آنرا به این
:(1998a ، صورت نشان داد (رایکوف
(۶) Xj = aj + bj T۱
عموم یترین مدل « مدل متجانس » بهطوري که در عبارت ( 6) ملاحظه میشود
اندازهگیري است، زیرا میتوان با رعایت هریک از پیشفرضهاي مدلهاي قبلی، مدل
متجانس را به یکی از مدل هاي محدودتر تبدیل کرد. بنابراین، سه مدل مورد اشاره در
هستند و به همین دلیل است که برخی از « مدل متجانس » بالا زیر مجموعه هاي
صاحبنظران سایر مد لهاي اندازهگیري را یکی از حالتهاي مدل متجانس می دانند
.( (رایکوف و هانکوك، 2005
براي تطبیق داده هاي حاصل از اندازهگیري با هر یک از مدلها از ویژگی سلسله ¨
مراتبی مدل هاي اندازهگیري استفاده میشود. به عبارت دیگر، براي انتخاب بهترین
44 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 44
مدل، از نامحدودترین و غیراقتصاديترین مدل بهسوي محدودترین و اقتصاديترین
مدل حرکت می شود تا بهینهترین مدل انتخاب گردد (گراهام، 2006 ). بدین منظور از
٦ استفاده میشود، یعنی ابتدا از مدل متجانس شروع شده و برازش « مدلهاي آشیانهاي »
این مدل با دادهها آزمون میشود. در صورت معنیداري، مدل معادل-تا و و یا اساساً
معادل-تاو آزمون میشود، یعنی مدلی که بارهاي عاملی آن برابر با یک درنظر گرفته
میشود. در صورتیکه تفاوت در مقادیر آمارة خیدو بین این دو مدل از نظر آماري
معنیدار نبود مدل محدودتر انتخاب شده و در غیر اینصورت مدل اولی و محدودتر به
عنوان مدل مناسب برگزیده میشود. در صورتیکه مدل معادل -تاو پذیرفته ش ود، مدل
موازي آزمون میگردد و خطاهاي اندازهگیري گویهها برابر فرضم یگردند . پس از
آزمودن مدل، تفاوت مقادیر خیدو (آماره تفاوت خیدو) بررسی می گردند . همانند
مرحله قبلی، در صورت معنیدار نبودن آماره تفاوت خیدو مدل محدودتر و در غیر
این صورت مدل نامحدودتر انتخاب می گردد (رایکوف، 1997 ). بنابراین، با توجه به
٧ در اندازهگیري، اگر دو مدل بهطور منطقی برازش پیدا کنند، برآورد « بهینه بودن » اصل
مدل محدودتر از مدل با محدودیت کم تر ترجیح داده خواهد شد. به این دلیل توصیه
شده است که قبل از انجام ه رگونه عمل اندازهگیري، پیش فرض هاي برآورد اعتبار
آزمون شده و مناسبترین مدل در رابطه با دادهها انتخاب گردد.
نیز از جمله شرایط استفاده از ضریب « خطاي اندازهگیري ناهمبسته » پیشفرض ¨
آلفا است. مطالعات نشان دادهاند که همبستگی بین خطاهاي اندازهگیري بر روي برآورد
2004 ؛ کوماروف، 1997 ؛ گرین و هرشبرگر، ؛ ضریب آلفا موثر است (رایکوف، 2001
2000 ؛ لوك، 2005 ). عمده مطالعات در این زمینه نشان میدهند که انحراف از
پیشفرض خطاهاي مستقل میتواند ضریب آلفا را متورم ساخته و در نتیجه ضرایب
آلفا بیش از مقدار واقعی آن برآورد گردند (کوماروف ، 1997 ؛ گرین و هرشبرگر،
2000 ). با اینحال، برخی از نوشتهها حاکی از کم برآورد کردن اعتبار در هنگام همبسته
2004 ). ولی بهطور کلی با توجه به ؛ بودن خطاهاي اندازه گیري دارد (رایکوف، 2001
پژوهشهایی که بهطور منظم این موضوع را بررسی کردهاند، میتوان چنین برداشت
کرد که چنانچه بین خطاهاي اندازهگیري در یک آزمون، همبستگی و به خصوص
٨ میکند (زیمرمن، زومبو « بیشبرآورد » همبستگی مثبت وجود داشته باشد، آلفا اعتبار را
45 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 45
و لالونده، 1993 ). این موضوع در مطالعه دیگري نیز تأئید شد و بر اساس آن مشخص
گردید که وجود خطاي همبسته میتواند تا اندازه اي، مقداري از کمبرآورد شدن اعتبار
به علت معادل-تاو نبودن را کاهش دهد (کوماروف، 1997 ) که معر ف تعامل رعایت
نکردن هر دو پیشفرضاست. مقدار سوگیري آلفا در هنگام بروز خطاهاي همبسته
قابل محاسبه خواهد بود (رایکوف، 2001 ). ناهمبستگی بین خطاهاي اندازه گیر ي از
٩ بهدست میآید. استقلال آماري به دو موضوع اشاره « استقلال آماري » طریق اجراي
دارد: اول آنکه مقدار مشاهده شدة افراد در یک گویه مستقل از مقادیر آنها در
گویههاي دیگر باشد و دوم اینکه مقدار مشاهده شدهي افراد در گویه بهطور آزمایشی
از مقدار مشاهده شده ي هر فرد دیگر در آن گویه یا گویه ها ي دیگر متفاوت باشد
(کوماروف، 1997 ). بنابراین پیشفرض استقلال آماري در هنگامیکه آزمون مشابه
باشند یا گویههاي مقیاس، تقریب همزمان نزدیکی داشته باشند، غیر قابل دفاع خواهد
بود. همبستگی بین خطاهاي اندازهگیري به دلایل متفاوتی رخ میدهد که از آن جمله
وجود یک نظم مشخص بین گویهها خواهد بود. در نتیجه براي پرهیز از بروز چنین
مشکلی میتوان براي به حداقل رساندن ثبات تصنعی، نظم گویهها را بهصورت تصادفی
تنظیم کرد. به عبارت دیگر با اینکار میتوان امیدوار بود که پاسخ افراد به نمره واقعی
آنها وابسته است و نه به پاس خهاي آنان در گویههاي قبلی. علاوهبراین، مواردي چون
اجرا شدن همه گویهها در یک مقیاس بهطور متوالی و در یک وضعیت یکسان، داشتن
عبارتپردازي یکسان و نمرهگذاري در یک جهت نیز از مواردي است که همبستگی
بین گویهها و خطاها را افزایش داده و در نتیجه ضریب آلفا را بیشبرآورد خواهد کرد
.( (گرین و هرشبرگر، 2000
دشواري رعایت پیشفرض ها به همراه فقدان قابلیت بررسی و آزمون آنها در ¨
روشهاي مرسوم اندازهگیري، ابهاماتی را در دقیق بودن ضریب آلفا بهوجود میآورد. به
همین خاطر معمولاً از ضریب آلفا به عنوان برآورد غیردقیق اعتبار یاد م یشو د. با
اینحال، در مواقعی که تعداد نسبتاً زیادي از مولفهها وجود داشته باشند (بیشتر از 6)، یا
0) و خطاهاي / بارها بهطور بالایی در یک سازة نهفتۀ مشترك بار داشته باشند (حداقل 6
اندازهگیري ناهمبستهاي وجود داشته باشند استفاده از آلفا مجاز خواهد بود (رایکوف ،
.(2004 ؛2001
46 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 46
با توجه به مطالبی که گفته شد میتوان نتیجه گرفت که در استفاده از ضریب ¨
حداقل دو مشکل وجود دارد. مشکل اول برآورده کردن « شاخص اعتبار » آلفا به عنوان
پیشفرضهاي لازم براي استفاده از ضریب آلفا و مشکل دوم آزمون کردن هر یک این
پیشفرضها در رابطه با دادههاي در دسترس میباشد. براي حل مشکل اول روشهاي
جايگزین ضریب آلفا پیشنهاد شده است. به عنوان نمونه در پیشفرض ناهمبسته بودن
خطاهاي اندازهگیري گویهها، در مدل معادلات ساختاري خطاهاي اندازه گیر ي را به
خطاي همبستۀ تولید شده توسط عامل و خطاي همبسته تولید شده توسط خطاي
اندازهگیري تفکیک میکنند. خطاي همبستهاي که توسط عاملها تولید م یشود واریانس
معتبر را مورد توجه قرار میدهد، در حالیکه خطاهاي همبسته تولید شده توسط خطاي
.( را درنظر میگیرند (گرین و هرشبرگر، 2000 « نامعتبر » اندازهگیري تصادفی واریانس
براي مواقعیکه مدل اساساً معادل-تاو نیست نیز روشهاي دیگري جايگزین ضریب
آلفا شدهاند که از آن جمله روش امگا یا معادل آن روش اعتبار سازه (بیکون، سائور و
یونگ، 1995 ؛ رایکوف و شراوت، 2002 ؛ زینبرگ، رول و یوول، 2007 )، روش امگ اي
وزنبندي شده (بیکون، سائور و یونگ، 1995 ) و روش ه اي موجود در روش مدل
معادلات ساختاري هستند. براي حل مشکل دوم (عدم توانایی براي آزمون کردن
پیشفرضها) مناسبترین و رایجترین روش، استفاده از مدل معادلات ساختاري است.
در این مقاله سعی میشود که جنبه هاي استفاده از شاخص ها و روشهاي ویژه موجود
در مدل معادلات ساختاري براي برآورد اعتبار و همچنین آزمون پیش فرض ها مورد
بررسی قرار گیرند. همچنین برخی مطالعات نشان دادهاند که ضریب آلفا نسبت به
( وجود نقاط پرت تأثیرپذیر است (لیو و زومبو، 2007
کاربرد روش مدل معادلات ساختاري در برآورد اعتبار ابزار به علت قابلیت ها و ¨
مزایاي استفاده از آن رواج یافته است. مهمترین دلیل استفاده از این روش عدم اجبار
براي رعای تکردن پیشفرض هاي سخت و جدي است که در روش آلفا وجود دارد. در
این روش امکان آن وجود دارد که از مدل اندازهگیري کمتر محدودشده اي همانند مدل
متجانس استفاده شود و در نتیجه الزام استفاده از مدل اساساً معادل -تاو از بین می رود
(آدامسون و همکاران، 2000 ؛ رایکوف، 1997 ؛ رایکوف و شراوت، 2002 ). خطاهاي
ناهمبسته نیز از جمله پیشفرضهاي اساسی در ضریب آلفاست که به عنوان همبستگی
47 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 47
خطاي اندازهگیري درنظر گرفته میشود، ولی در روش مدل معادلات ساختاري کاملاً
١٠ درنظر گرفته نمیشود بلکه به عنوان « خالصیا ناب » به صورت خطاي اندازهگیري
عوامل باقیمانده مشخصنشده مورد توجه قرار میگیرند. این نمرات باقیمانده هم
مولفههاي تصادفی و هم مولفههاي غیرتصادفی را در بر می گیرند. خطاهاي همبسته
بهصورت همپراکندگی تولید شده توسط مولفههاي غیرتصادفی یا عواملی هستند که
لزوماً بهصورت نااعتبار ملاحظه نمیشوند (گرین و هرشبرگر، 2000 )، در نتیجه می توان
بین خطاهاي اندازهگیري گویهها همبستگی درنظر گرفت. به عبارت دیگر، دو گویه
می توانند تأثیرات تصادفی مشترکی را دربرگیرند که در نمرات خطاي مرتبط با آنها
مشترك بوده و به همبستگی بین این خطاها منجر شوند (رایکوف، 2001 ؛ کوماروف،
1997 ). علاوه بر مزیت آزاد بودن از رعایت پیش فرض ها، در روش هاي برگرفته از
مدل معادلات ساختاري امکان محاسبه اعتبار با استفاده از عملکرد وزنبندي کردن
گویهها نیز وجود دارد. استفاده از بارهاي غیر مساوي گویه ها براي برآورد اعتبار در
زمانی که گویهها بهطور مساوي بر برآورد ساز هها تأثیر نمیگذارند، مفید است (بیکون،
1998 ). همچنین به علت انعطاف بالاي روش مدل a ، سائور و یونگ، 1995 ؛ رایکوف
معادلات ساختاري امکان بررسی تفاوتهاي گروهی در اعتبار مرکب، بررسی تفاوت
اعتبار در نسخههاي متفاوت ابزار اندازه گیري (مثلاً نسخه قلم و کاغذي در مقابل نسخه
1998 )، به دست a ، رایانهاي) (رایکوف، 2004 )، استفاده از دادههاي مقوله اي (رایکوف
آوردن خطاهاي معیار و فواصل اطمینان براي اعتبار مرکب در حالتی که به پیش فرض
،( 1998 ؛ رایکوف و شراوت، 2004 a ، نرمال بودن مولفهها وابسته نباشند (رایکوف
فراهم میگردد. امکان محاسبه میزان سوگیري و کمبرآوردي ضریب آلفا نیز از دیگر
2001 ). به تمامی ؛1998b ؛ قابلیتهاي روش مدل معادلات است (رایکوف، 1997
مزایاي اشاره شده میتوان امکان آزمون کردن پیشفرضها را اضافه نمود که با سایر
روشها قابل انجام نیست.
با وجود مزایاي مدل معادلات ساختاري در برآورد اعتبار، ملاحظاتی در مورد
استفاده از این روش باید انجام پذیرد که مهمترین آن نیاز به نمونههاي بزرگ
مشارکتکنندگان است. این امر بهویژه در مورد دادههاي طبقهاي که تعداد محدودي
گزینه براي پاسخ دارد، از اهمیت خاصی برخوردار است زیرا در اینگونه مواقع روش
48 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 48
١١ براي آزمون مدل مورد نیاز بوده که این « مجذورات وزنبندي شده » برآورد حداقل
روش حساسیت زیادي در مورد استفاده از نمونههایی دارد که به طو ر بهینه بزرگ
2004 ). لذا در این موقعیتها استفاده از ؛2001 ؛ شناخته میشوند (رایکوف، 1997
نمونههاي کوچک براي برآورد اعتبار مرکب گمراهکننده است. علاو ه بر ای ن، تعداد
گویهها ملاحظه قابل توجهی در آزمون مدل هاي اندازهگیري بهشمار میرود. در مواقعی
که تنها دو گویه وجود داشته باشد، روشهاي محاسبه اعتبار تنها براي مدل هاي موازي
یا معادل -تاو قابل کاربرد هستند زیرا براي حالت آزمون موازي، مدل دو پارامتر آزاد
١٢ است (درجه آزادي برابر با یک است). در این « بیششناساییشده » دارد و بنابراین
موقعیت با افزودن محدودیتهاي اضافی همچون برابري بارهاي شاخص(مدل معادل-
تاو) و یا برابري واریانس خطا (مدل موازي) مدل در حالت قابل برازشی قرار میگیرد
(رایکوف و هنکوك، 2005 ). براي مدل معادل -تاو، این مدل سه پارامتر آزاد دارد و
١٣ است (درجه آزادي برابر با صفر است). مدل متجانس در این « کاملاً شناساییشده »
وضعیت کم شناساییشده بوده (درجه آزادي آن منفی است) و بنابراین کاربرد عملی
ندارد (یورسکاگ و سوربوم، 1993 ). در زمانی که سه گوی ه وجود دارد، مدل متجانس
١٤« مدل اشبا عشد ه » کاملاً شناساییشده و قابل برآورد میشود ولی نمی توان آن را با
.( مقایسه کرد زیرا هر دوي این مدلها داراي درجه آزادي صفر هستند (رایکوف، 1997
با گویههاي بالاتر از چهار، تمامی مدلها کم شناسای ی شد ه بوده و در مقابل مدل
اشباعشده قابل دفاع خواهند بود.
در استفاده از مدل معادلات ساختاري براي برآورد اعتبار روشهاي مختلفی ¨
پیشنهاد شده است. بهطور کلی می توان این روشها را به دو دستهي روش ه اي مبتنی
بر تک تک گویهها یا متغیرهاي مشاهده شده و روشهاي مبتنی بر ترکیب متغیرهاي
مشاهده شده تقسیم نمود. گرایش بیشتر پژوهشگران و صاحبنظران بر استفاده از
روشهاي مبتنی بر ترکیب گویه هاست تا به این وسیله بتوانند جایگزینهاي مناسبی را
براي روشهاي مرسومی همچون آلفا پیشنهاد دهند. با این وجود در ابتدا روش ه اي
مبتنی بر تک تک گویهها معرفی میگردند.
مشخصشد که اعتبار قسمتی از اندازهگیري است که مشمول « اعتبار » در مفهوم ¨
اعتبار به عنوان ،« مدل معادلات ساختاري » خطاي تصادفی نمیشود. بنابه تعریف در
49 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 49
تعریف میشود (راین س- « واریانسی که به وسیله خطاي اندازهگیري تبیین نمیشود »
128 ). مشهورترین شاخصی که بر مبناي بررسی ت کتک گویه ها معرفی ، اودي، 2000
١٥ نام دارد که نشا ندهند ه مقدار « ضریب مجذور همبستگی چندگانه » ، شده است
توسط متغیر نهفته است (راینس- اودي، 2000 ؛ قاضی x واریانس تبیین شده در متغیر
طباطبایی، 1377 ؛ یورسکاگ و سوربوم، 1993 ). این شاخص به عنوان حد پائین اعتبار
مورد توجه قرار میگیرد، به این معنی که اعتبار هر گویه حداقل برابر x براي متغیرهاي
با مجذور همبستگیهاي چندگانه است (قاضی طباطبایی، 1377 ؛ یورسکاگ و سوربوم،
1993 ). مقادیر این شاخص از طریق خروجیهاي برنام ههاي رایانه اي مدل معادلات
بهدست میآیند و مقدار آن بین صفر و یک است. جهت LISREL ساختاري همچون
0 به عنوان ضرایب مناسب درنظر گرفته / تفسیر این شاخص ها، مقادیر بالاتر از 5
میشوند (راینس- اودي، 2000 ). همچنین جداي از این شاخص، همبستگی هر گویه
با متغیر نهفته در هر زیرمقیاس نیز به عنوان ضریبی براي ثبات درونی هر گویه معرفی
.( شده است (عابدي، 2002
راهبرد دوم ترکیب متغیرها که رواج زیادي پیدا کرده است، ترکیب همه گویه ها ي
١٦ یاد می شو د. این « اعتبار مرکب » یک عامل با همدیگر است که از آن روش به عنوان
روش بر اساس مفهوم اصلی اعتبار در نظریه کلاسیک آزمون بنا شده است که اعتبار را
به عنوان سهم واریانس نمره واقعی به واریانس نمره مشاهده شده درنظر میگیرد. بدین
منظور لازم است که برآوردهایی براي واریانس نمره واقعی و واریانس نمره مشاهده
شده داشته باشیم. واریانس نمره مشاهده شدهي یک اندازه میتواند توسط ایجاد یک
متغیر مشاهده شده ترکیبی در دسترس قرار گیرد که توسط جمع واریانسهاي تکتک
متغیرهاي مشاهده شده بهوجود میآید (گراهام ، 2006 ). در این روش یک شاخص
آماري براي برآورد اعتبار مجموعه اي از گویهها که در یک عامل قرار دارند ارائه
میشود. با توجه به نوع ترکیب گویهها و وضعیت خطاهاي آنها (با خطاي همبسته و
بدون خطاي همبسته) فرمولهاي چندگانهاي پیشنهاد شده است که قابل تبدیل به
یکدیگر میباشند. در حالت کلی و مدلهاي متجانس و ه مچنین گویه ها ي وزنبندي
، نشده، اعتبار مرکب بهوسیله این فرمول بهدست می آی د (آدامسو ن و همکارا ن، 2000
:(345 ، 973 ؛ رایکوف، 2004
50 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 50
å å
å
= =
=
+ k
i 1 ii
k
i 1
2
i
k
i 1
2
i
( )
( )
b
b θ ( = اعتبار مرکب ( 7
å= دراین عبارت
k
مجموع ضرایب بین متغیرهاي مشاهده شده و نهفته i 1bi
å= گویه و k ( (بارعاملی
k
i 1 ii گویه را نشان م یده د. در k مجموع واریانس هاي خطاي θ
صورتیکه بین خطاهاي اندازهگیري همبستگی وجود داشته باشد، از فرمول زیر استفاده
:(344 ، میشود (رایکوف، 2004
å å å
å
= = £ < £
=
+ +
1 i j k jj
k
i 1 ii
k
i 1
2
i
k
i 1
2
i
( ) θ 2 θ
( )
b
( اعتبار مرکب ( 8 = b
کوواریانس خطاي غیرصفر است. qjj(1£i< j£k) در این عبارت
این دو فرمول قابل تبدیل به وضعی ت گوی ه ها ي وزنبندي شده هستند. در
این حالت، گویهها با وزنهاي خاصی با همدیگر ترکیب شده و نمره مرکبی را بهوجود
میآورند. نمره مرکب از طریق عبارت زیر بهدست میآید:
(9)Y = w1y1 + w2y2 + ... + wkyk
از پیش مشخصهستند (چگونگی بهدست wk ،... ،w2 ،w دراین عبارت وزن هاي 1
آوردن وزنها در قسمت هاي بعدي توضیح داده خواهد شد). اعتبار مرکب یک آزمون
:(344 ، وزنبندي شده از طریق فرمول زیر محاسبه میگردد (رایکوف، 2004
å å
å
= =
=
+ k
i 1 ii
2i
k
i 1
2
i
k
i 1
2
i
( i ) θ
( i )
w b w
( اعتبار مرکب ( 10 = w b
:(345 ، در حالت خطاهاي همبسته (رایکوف، 2004
å å å
å
£ < £
= =
=
+ +
1 i j k
i j jj
k
i 1 ii
2i
k
i 1
2
i
k
i 1
2
i
( i ) θ 2 w w θ
( i )
w b w
( اعتبار مرکب ( 11 = w b
روش هایی که در بالا توضیح داده شد، برآورد نقطه اي اعتبار مرکب را نشان
میدهند. میتوان با استفاده از روشهایی برآورد فاصله اي اعتبار مرکب را نیز محاسبه
کرد. برآورد فاصلهاي در مطالعات اعتبار میتواند مفید باشد. بر پایه چنین روشهایی
نتایج حاصل از برآورد اعتبار به فواصل مشخصی تعریف میشود (رایکوف و شراوت،
.(2002
51 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 51
علاوه بر روش بالا م یتوان اعتبار مرکب را از طریق تعریف پارامترهاي جدید در
١٧ در مدلها محاسبه نمود. این کار از طریق تعریف « برازش شده » یک مدل از قبل
١٨ امکانپذیر است. در این روش با محدود کردن ضرایب در نمرات « متغیر خیالی »
مشاهده شده، نمرههاي مشاهده شده به مجموع نمرات خطا و نمره واقعی تجزیه
نامیده میشوند، با همدیگر ترکیب میگردند تا نمره Xi میشوند. سپس این نمرات که
به وجود آید. مجذور همبستگی متغیر خیالی با متغیر نهفته اعتبار مرکب (F) متغیر خیالی
آزمون را نشان خواهد داد (رایکوف ، 1997 ؛ گراهام ، 2006 ). شکل نمادین ساخت
متغیر خیالی در شکل 1 مشخصشده است.
.(176 ، شکل 1- چگونگی ساخت متغیر خیالی (منبع: رایکوف، 1997
می توان بهجاي محدود کردن پارامترها در عدد یک، از وزنهاي شناخته شدهاي
براي هریک از مسیرها استفاده کرد. در انتخاب این وزنها (wk ،... ،w2 ،w (همچون 1
میتوان یا از پژوه شهاي قبلی و یا از دانش نظري توسط صاحبنظران استفاده کرد.
T
X٢ X٣ … Xk
x١
F
E٢ E٣
E١
Ek
١
١ ١
٭ ٭ ٭
٭٭٭
١ ١
…
52 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 52
همچنین با توجه به قابلیت عدم الزام براي تشخیص دقیق ضرایب مسیر، میتوان از
به عنوان وزن استفاده نمود (رایکوف ، 1997 ). بنابراین با (λi) برآوردهاي بار عاملی
میتوان متغیر خیالی را بهوجود wi=λi محدود کردن ضرایب نمرات مشاهده شده در
آورده و از طریق آن برآوردي از اعتبار مرکب وزنبندي شده را بهدست آورد. به طور
کلی کاربرد این روش با استفاده از نرمافزارهاي آماري مدل معادلات ساختاري قابل
انجام است. دراستفاده از این روش باید بهخاطر داشت که از مدلهایی استفاده گردد که
قبلاً ساختار آنان برازش یافته باشد.
١٩« اعتبار بیشینهاي » در نهایت، روش آخري که مورد بحث قرار می گیرد، ضریب ¨
است که به عنوان شاخص اعتبار سازه تعریف میشود که میتوان سازه نهفته را
توسط شاخصهاي سازه درنظر « لحاظ شده » بهصورت مقداري تعریف شده و یا
گرفت (رایکوف و هنکوك، 2005 ). اعتبار بیشینهاي به عنوان آخرین شاخص براي
برآورد اعتبار در روش مدل معادلات ساختاري پیشنهاد شده است. این شاخص از
ترکیب مجموعهي از پیش تعریف شدهاي از مولفههاي متجانس با عبارتهاي خطاي
ناهمبسته تشکیل شده است. این روش میتواند در ساخت، توسعه و تجدید نظر مقیاس
بهینه به کار آید. قابلیت مهم آن در سنجش تغییرات اعتبار بیشینهاي در نتیجه حذف و یا
افزودن یک یا چند اندازه است. همچنین با استفاده از ترکیب خطی وزنبندي شده
می توان اعتبار مرکبی را بهوجود آورد که داراي بالاترین درجه تفکیکپذیري در جنبه
نهفته مورد نظر بوده و حداقل واریانس خطاي نسبی ممکن را داشته باشد. با این
ترکیب وزنبندي شده آماره رضایتبخشی از نمره توانایی نهفته بهدست م یآید .
بررسیهاي تجربی نشان میدهند هنگامیکه نمرات عامل با روش برآورد حداقل
٢٠ در یک مدل تکعاملی برآورد م یشود، اعتبار بیشین هاي با « مجذورات عمومی شده »
روش متغیر خیالی (مجذور همبستگی بین عامل و ترکیب برآورد کننده ه ا) مساوي
.( است (رایکوف و هنکوك، 2005
تعیین وزن ها از اهمیت خاصی برخوردار است. « اعتبار بیشینهاي » در روش ¨
روشهاي متفاوتی براي اینکار پیشنهاد شده که در قبل به چند مورد از آنها اشاره شد.
در تکمیل این بحث دو روش دیگر نیز معرفی میشود که اولی به صورت نسبت بار
53 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 53
عاملی به خطاي آن است که میتوان آنرا بهصورت زیر نوشت (کانجر، 1980 ، به نقل
:( از رایکوف و هنکوك، 2005
(i , ,...,m) θ
w β
i
* i
i (12) = =12
دومین روش که کاربرد زیادي در اعتبار بیشینهاي دارد به نسبت مجذور بارهاي
به خطاي مرتبط با آن تعریف میگردد که به این صورت (η اندازهها در جنبه مشترك ( 1
آنرا میتوان نشان داد:
( ,..., ) * i m
i
i
wi 1,2
2
= = q
(13) b
(ρi با ملاحظه چگونگی محاسبه وزن ها، ضریب اعتبار بیشینه اي جامعه
(* به این
:(68 ، صورت محاسبه میشوند (رایکوف و هنکوك، 2005
å
å
=
=
+
= m
i 1 i i
m
* i 1 i i
(m) ( )
( )
θˆ
βˆ
θˆ
βˆ
ρˆ 2
2
1
(14)
آزمون تغییرات در اعتبار بیشینهاي به عنوان نتیجهاي از حذف و افزودن متغیرها ¨
یکی ازجنبههاي مهم این روش است. بنابر این روش، اگر بخواهیم که ابزاري با
اندازه متجانس m بالاترین اعتبار بیشینه اي را از طریق مجموعه از پیشتعریف شده اي با
باید بالاترین نسبتهاي مجذور بار ،(m>k) ،( اندازه k در اندازه معینی بسازیم (مثلاً
شاخص در واریانس خطاي مرتبط ( )
θ
β
i
i
2 را انتخاب کنیم. در نمونههاي معین از جامعه
مورد علاقه، ترتیب رتبه و انتخاب باید بر حسب نسبتهاي
q
b
ˆ
ˆ
i
از (i = 1,2,...,m) ، i
مولفه انجام میشود. پس از انتخاب m پارامترهاي برآورد شده در هنگام برازش مدل با
مولفه، برآورد بیشینهاي مجموعه کوچکتر محاسبه میشود و سپس آزمون معنی داري k
تغییرات در اعتبار بیشینهاي انجام میشود. فرضصفر در این آزمون به این صورت
است:
r r*
( )
*
H0 (m) = k (15) =
c2 c2 c آماره آزمون بر اساس 2
m k m k
D = -
( , ) محاسبه شده که براي نمونههاي بزرگ
درجه آزادي پیروي میکند. اگر خیدو تفاوت معن یدار m-k از توزیع خیدو مرکزي با
بود، فرض صفر رد می شود و نتیجه گرفته می شود که اعتبار بیشینهاي به عنوان نتیجه اي
m-k اندازه، کاهش خواهد یافت و یا با افزودن m مولفه از مجموعه اولیه m-k از حذف
54 / مجلۀ روانشناسی 53 / مقایسه ضریب آلفا و روشهاي ... / 54
اندازه اعتبار افزایش خواهد یافت (رایکو ف و هنکوك، k اندازه در مجموعه اولیه
2005 ). ذکر این نکته لازم است چنان چه در اعتبار بیشین هاي فرضمیشود هنگام
حذف اندازهها از مجموعه اولیه اندازههاي متجانس، هیچ گاه اعتبار بیشین هاي بالاتري
بهدست نمیآید و تنها میتوان بررسی کرد که آیا کاهش چندین اندازه میتواند از نظر
آماري بر کاهش اعتبار بیشینهاي موثر باشد یا نه؟ برآورد نقطهاي میزان تغییرا ت اعتبار
بیشینهاي نیز میتواند با استفاده از فرمول مربوطه و همچنین متغیر خیالی بهدست آید.
توجه به ملاحظاتی لازم است؛ از جمله آنکه « اعتبار بیشینهاي » در استفاده از ¨
و همراه با رعای ت k= تعداد اندازهها در کوتاهترین ابزار مورد بررسی باید به میزا ن 2
باشد. همچنین براي کاربرد این روش با نرمافزارهاي موجود کنونی، باید m>k
مولفه هاي (تقریباً) پیوستهاي را مورد بررسی قرار داد، در غیر اینصورت میتوان از
٢١ استفاده نمود. علاو ه بر ای ن، این « ساخت بسته » ماتریس همبستگی پلیکوریک و یا
روش بر اساس مولفههاي متجانس و خطاي اندازهگیري ناهمبسته استوار شده است.
بنابراین، اگر حداقل یکی از این پیشفرضها رعایت نشود، مدل توصیف شده ممکن
٢٢ باش د « زیربهینهاي » است نتایج گمراه کنندهاي را بهبار آورده و مستلزم ترکیب ابزار
(رایکوف و هنکوك، 2005 ). بنابراین قبل از اینکه از این روش استفاده شود، باید مدل
تکعاملی در همه مولفهها برازش شده و برازش آن براي قابل دفاع بودن و مناسب
بودن شاخصهاي اصلاح در کوواریانس خطا مشخصشود.