کاربرد تحلیل داده های شبکه ای محتوای شبکه های اجتماعی موبایلی، به منظور سنجش ویژگی های  شخصیتی، توان

نویسنده و مسول مقاله: محمد حسین ضرغامی (دکتری سنجش و اندازه گیری)

یکی از مهمترین موانع جدی تصمیم گیری برای کسانی که لازم است دست به قضاوت و ارزشیابی بزنند- مثلا روانشناسان، مشاوران، مدیران و غیره- اطلاعاتی است که عموما از طریق روش های خودگزارش دهی[1] جمع آوری می‏ شوند. روش های خودگزارش دهی عمدتا از طریق مصاحبه، پرسشنامه، چک لیست و یا مشاهده صورت می پذیرند. به نظر می رسد استفاده از داده های فیزیولوژیکی مانند نتایج بدست آمده از EEG، MRI، FMRI، Eye tracking و ... بتواند بر بعضی از مشکلات ناشی از روش های خودگزارش دهی فائق آید. با این وجود استفاده از این روش ها علاوه بر این که نیازمند ابزار و هزینه های خاص است، میزان موفقیت آنها در بیشتر مقالات گزارش شده، تفاوت معناداری با نتایج بدست آمده از روش های خودگزارش دهی ندارد. شایان ذکر است که مساله ی اعتباریابی این روش ها، به همان اندازه‏ ی روش های خودگزارشی سوال برانگیز است.

ظهور شبکه های اجتماعی آنلاین[2] یکی از حوزه های پر هیجان دهه‏ ی اخیر مخصوصا در روابط اجتماعی به شمار می رود. شبکه های اجتماعی موبایل مانند وایبر[3]، تلگرام[4]، واتس اپ[5]، تانگو و سایر شبکه های اجتماعی در بین کاربران به سرعت محبوب شده اند. چنین شبکه هایی به لحاظ محتوایی فوق العاده غنی اند و حجم بسیار بالایی از محتوا و داده های ارتباطی را در بر می گیرند که برای دستیابی به اهداف مختلف مورد تحلیل قرار می گیرند. امروزه داده های چنین شبکه هایی به عنوان طلای سیاه در نظر گرفته می شوند(هان و کامبر، 2011).

 

 

 

 

 

 

ساختار اطلاعات[6] موجود در شبکه های اجتماعی با مولفه های نظریه گراف[7] همخوان است. دو مولفه ی اساسی تئوری گراف، رآس[8]  و یال[9] است. راس یا گره در شبکه های اجتماعی متون، تصاویر و سایر چند رسانه‏ای‏ها است و یال یا ارتباط بین رئوس، ویژگی یا چیزی است که به عنوان رابط بین گره ها در نظر گرفته می شود. غنای چنین شبکه هایی فرصت های بی سابقه ای را برای تحلیل‏گران داده در حوزه های مختلف، از فلسفه تا علم[10] فراهم می آورد.

 

 

 

 

 

 

 

شبکه اجتماعی می تواند بر اساس اهداف مختلف به شیوه های گوناگون تعریف شود. به عنوان مثال یک گروه دوستی می تواند به عنوان یک شبکه ی اجتماعی مقصود اصلی مطالعه باشد. البته پر واضح است که اگر صرف ارتباط، مورد نظر باشد؛ هر گروه دوستی در شبکه های اجتماعی موبایل، در برگیرنده ی تمام افراد جهان می شود که برنامه ی مربوط به آن شبکه را روی موبایل خود نصب کرده و از آن استفاده می کند. از این منظر شما خواننده عضو تمام گروههای دوستی موجود در جهان می باشید و در صورت فائق آمدن بر موانع سخت افزاری و نرم افزاری می توانید ارتباط دلخواهتان را برقرار نمایید. به لحاظ نظری و تجربی این موضوع سال ها قبل از پیدایش موبایل و اینترنت توسط میلگرام در مقاله ای با عنوان جهان کوچک[11] مطرح و به لحاظ تجربی ثابت شده است(https://en.wikipedia.org/wiki/Small-world_experiment). بنابراین تعیین حد و مرز و تعریف شبکه ی مورد مطالعه بسیار اهمیت دارد و این مهم، از طریق الگوریتم های مبتنی بر مدل های آماری گراف و داده های شبکه ای[12] امکان پذیر است.

شخصيت را شايد بتوان اساسی ترين موضوع علم روان شناسی دانست؛ زيرا محور اساسی بحث در زمينه هايی مانند يادگيری، انگيزش، ادراک، تفکر، عواطف و احساسات، هوش و مواردی از اين قبيل است. از طرف ديگــر، در مطالعــه ی بيماری هــای روانی کنشی، مانند انواع ســايکوزهای کنشی، اختلالات شخصيت و منش، تمام نوروزها، رفتارهای ضد اجتماعــی و ضد اخلاقی، اعتياد و انحراف ها، شخصيت نقش محوری و اساسی دارد. در رابطه با جايگاه و اهميت شخصيت در روان شناسی، گفته شده است که شخصيت مانند ديگی است که همه ی مخلفات روان شناسی در آن پخته می شود (شاملو، ۱۳۷۷). از این رو سنجش ویژگی های شخصیتی و توانمندی های هوشی در حوزه ی منابع انسانی[13] و روانشناسی غیر قابل انکار است به طوری که بخش عظیمی از فعالیت ها و تلاش های روانسنجان در گذشته و در زمان حال را به خود اختصاص داده است.

 

 

 

 

 

 

تشخیص بالینی مهمترین و پایه ‏ای ترین گام درمان به شمار می رود که توسط روانشناسان و روانپزشکان و عمدتا بر اساس نشانگان بالینی مراجع صورت می پذیرد. با وجود آموزش های مختلفی که این متخصصان دریافت می کنند، تشخیص های بالینی می تواند از سوگیری های فردی[14]، فرافکنی شخصی[15]، اثر معیار سرایت، اثر هاله ای[16]، نقاب های اجتماعی[17] و سایر عوامل مختل کننده که ناشی از ارتباط بین فردی[18] است؛ متاثر شود. علاوه بر این فرد می تواند در خود اظهاری به خاطر مجموعه‏ ی کلانی از عوامل فردی و اجتماعی در روند تشخیص و درمان اختلال ایجاد نماید. در کنار تجارب و پیشینه ی مراجع و درمانگر، کلیه ‏ی مولفه های فضا-زمان[19] و تعاملات بین آنها نقش تعیین کننده ای در فرآیند تشخیص، درمان و درمان پذیری دارد.

به کارگیری و استفاده از شیوه های سنجش غیر مستقیم[20] در تشخیص بیماری های روانی و یا برآورد ویژگی های شخصیتی افراد بسیار ضروری است. استفاده از روش های کشف دانش[21] مبتنی بر شبکه ‏های اجتماعی (مانند شبکه های اجتماعی موبایل) می تواند در خدمت کسانی باشد که هدف آنها سنجش ویژگی های شخصیتی، توانمندی های هوشی و تشخیص بیماری های روانی است. خود ابرازگری افراد در این روش ها نسبت به موارد گفته شده بیشتر است، موانع اجتماعی به حداقل رسیده و شبکه ی ارتباطی فرد، امکان اعتباریابی تشخیص ها را فراهم می آورد. بنابراین از نگاه درمانی علاوه بر فرد، شبکه ی بسیار وسیعی از جهان ارتباطی وی و دیتای قابل توجهی از محتوای کلام در قالب نشانه –متن و تصویر و سایر ابزار چند رسانه ای- در دسترس است که می تواند شخصیت، توانمندی های شناختی و غربالگری روانی را به صورت غیر مستقیم سنجش نماید و درمان را به لحاظ ساختاری، به صورت همزمان، فردی و گروهی نماید.

 

  1.  شاملو، سعید، «مکتب ها و نظریه ها در روانشناسی شخصیّت»، تهران، رشد، انتشارات رشد، 1390.

Han, J., Kamber, M., & Pei, J. (2011). Data mining: concepts and techniques: concepts and techniques. Elsevier.



[1]. Self-report

[2]. Online social networks

[3]. viber

[4]. telegram

[5]. What’s up

[6]. Information structure

[7]. Graph theory

[8]. node

[9]. edge

[10]. science

[11]. the small world

[13]. Human Rescores

[14]. Individual biases

[15]. Personal projection

[16]. Halo effect

[17]. Social persona

[18]. Intra individual

[19]. time-space components

[20]. Indirect assessment

[21]. Knowledge discovery

استفاده از مدل های ساختاری فازی در کنار نظریه سوال پاسخ به منظور شخصی سازی تحلیل ساختاری دانش

کاربردهاي فراوانی براي تحلیل ساختار فازي متصور شده اند. یکی از پرکاربردترین آنها استفاده از این تحلیل ها براي تحلیل ساختار دانش است. ارائه و نمایش دانش یکی از اهداف مطالعاتی روانسنجی است که در سال هاي اخیر به طور مبسوط مورد بررسی دانشمندان در حوزه ي روانسنجی قرار گرفته است. سیستم هاي خبره و آزمایشات مختلفی که با سیستم هاي بصري کامپیوتري انجام می شوند، مبتنی بر رویکرد دانش محور است. بنابراین تحلیل ساختار دانش یک روش شناسی پیچیده  و مشکل است. در بین تحلیل هاي سیستم پیچیده، مدل تفسیري ساختاري Interpretative structural بر مبناي نظریه ي گراف رشد یافت. این نظریه به عنوان یک راه موثر در ساخت مدل هاي ساختاري fuzzy modeling ستم هاي پیچیده است. با این وجود محدودیت هاي روابط دوتایی بین عناصر کاربرد آن را کاهش داده است.

روابط دوتایی نمایش قدرتمندي از دنیاي واقعی نیست. مدل فازي ساختاری (Fuzzy structural modeling) توسط تاکاسی و آماگاسا معرفی شد. این مدل می تواند به صورت سلسله مراتبی براي مسایل پیچیده ي چند گانه به کار رود. این مدل می تواند روابط دو گانه را به روابط فازي تبدیل نمایید. این مدل می تواند در سیستم ها و رشته هاي مختلف به کار رود. ساختار دانش با توجه به دانش شخصی ذخیره شده و کاربردي شده می تواند متغییر باشد. شخصی سازي تحلیل ساختاري دانش یک امر مهم محسوب می شود. به منظور شخصی سازی تحلیل ساختاری دانش از نظریه ی سوال پاسخ IRT استفاده می شود. از طریق این نظریه ماتریس مفهوم- سوال بدست خواهد آمد و توانایی فرد مشخص می گردد که نتیجه نهایی آن ماتریس فازی شخصی شده است. بعد از تشکیل این ماتریس، پژوهشگران می توانند از مدل ساختاری فازی به منظور تهیه ی ساختار زنجیره ای و سلسله مراتبی دانش استفاده کنند. نتایج سلسله مراتبی دانش بدست آمده می تواند در تشخیص شناخت استفاده شود. 

طرح های آزمایشی در تقابل با طرح های نیمه آزمایشی

مقدمه
بررسی بسیاری از برنامه ها و طرح های رفاه اجتماعی نشان می دهد که این برنامه ها به طور موفقی اجرا شده اند؛ چرا که به نظر می رسد مراجعین بعد از انجام برنامه ها عملکرد خوبی داشته اند. مثلا ممکن است بیشتر افراد بعد از گذراندن دوره های آموزشی شغل مناسب پیدا می کنند. یا بیشتر افراد می توانند ارتباطات بین فردی خود را به نحو موثری گسترش دهند. با این وجود سوال اساسی این است که: آیا آموزش گیرندگان در برنامه های رفاه اجتماعی، به خاطر شرکت در برنامه های آموزشی توانسته اند شغل مناسب (یا ارتباطات موثر) بدست آورند یا علت چیز دیگری است؟ پاسخ گویی به این سوال هسته‏ی اصلی و مهمترین وظیفه ی ارزشیابی اثربخشی یک برنامه یا سیاست است. به بیان دیگر سوال این است که اگر مراجعین در این برنامه ها حضور پیدا نمی کردند، چه اتفاقی برای آنها رخ می داد؟
فعالیت کلیدی و محوری در این مثال این است که اندازه ی اثر برنامه یا سیاست اعمال شده از سایر عوامل و متغیرهای مستقلی که ممکن است بتوانند روی نتیجه بدست آمده، تاثیر بگذارند(مانند شرایط اقتصاد محلی، ویژگی های شرکت کنندگان و کیفیت مدیریت پروژه)؛ جدا شود و به صورت ایزوله سنجش و اندازه گیری گردد(در واقع همان سوال اصلی در بررسی روایی درونی). برای انجام این کار پژوهشگران سعی می کنند تا یک موقعیت مقابل (counterfactual) موقعیت آزمایشی در نظر بگیرند؛ تا ببیند در این موقعیت، برای گروه مشابه شرکت کنندگان در برنامه، چه روی می دهد؟ موقعیت مقابل در طرح آزمایشی همان گروه کنترل و در طرح های شبه آزمایشی همان موقعیت مربوط به گروه گواه یا شاهد است. به بیان دیگر هدف از طرح های آزمایشی کامل و شبه آزمایشی، مقایسه بین موقعیتی است که در آن متغیر یا متغیرهای مستقل اعمال می شود، با موقعیتی که در آن مداخله ای صورت نمی گیرد.
مقدمه ی مطرح شده به خاطر این است تا سناریوای تنظیم کنیم، که ابتدا پژوهشگران از روش های آزمایشی در انجام این پروژه استفاده کنند و سپس از روش های نیمه آزمایشی و در نهایت به مقایسه ی بین دو روش خواهیم پرداخت.

روش های آزمایشی
بسیاری از محققان اجتماعی باور دارند که طرح های آزمایشی بهترین روش برای سنجش تاثیر یک برنامه و یا سیاست گذاری هستند. در یک روش آزمایشی، افراد، خانواده ها و یا دیگر واحدهای تحلیل به صورتی تصادفی یا به عنوان گروه کنترل و یا در گروه آزمایش treatment گمارده می شوند. تنها گروه اصلی مورد مطالعه در معرض برنامه و یا سیاست جدید به عنوان متغیر مستقل قرار می گیرد و گروه کنترل در معرض آن قرار نمی گیرد.
اگر طرح آزمایشی به خوبی برنامه ریزی و اجرا شود، می تواند به گروه های کنترل و اصلی ای منجر شود که درون آنها ویژگی های غیر قابل سنجش و قابل سنجش وجود دارند. ویژگی های قابل سنجش ناشی از اعمال متغیرهای مستقل (در اینجا برنامه ها و سیاست های رفاه اجتماعی) است و ویژگی های غیر قابل سنجش ناشی از عوامل بیرونی است که مطلوب شرایط پژوهش نمی باشند، مثل شرایط اقتصادی، محیط های اجتماعی و دیگر رویدادهایی که تفاوت های ایجاد شده (واریانس ایجاد شده) توسط آنها، قابل ارجاع به مداخله (برنامه آموزشی رفاه اجتماعی) نباشد.
بنابراین، طرح های آزمایشی عموما نیازمند استفاده از روش های آماری به منظور کاهش تفاوت میان گروه های کنترل و گروه های آزمایش نمی باشند. از این رو نتایج بدست آمده از طرح آزمایشی کامل، مدیران و سیاست گذاران را قادر می سازد تا به جای انجام بحث های دنباله دار در مورد اینکه آیا یافته ها در یک مطالعه خاص از لحاظ آماری معتبر هستند یا خیر، بر نتایج نهایی بدست آمده تمرکز نمایند. بنابراین در روش های آزمایشی کامل، کنترل متغیرهای مداخله گر یا عوامل تهدید کننده ی درونی به جای تمرکز بر روش های آماری، بر روش شناسی آزمایشی تکیه دارد. این روش شناسی به گونه ای تنظیم می شود، که نتایج بدست آمده، می تواند به صورت علی تفسیر شوند. همانطور که خواهیم دید، این مورد برای طرح های شبه آزمایشی مصداق ندارد. اگر گروهی که در معرض برنامه ی آموزشی خاص قرار گرفته اند، نسبت به گروه کنترل تفاوت معنادار و مثبتی داشته باشند، می توان نتیجه گرفت که دوره های آموزشی یا سیاست اعمال شده ی مورد نظر موثر است و سبب بهبود وضعیت رفاه اجتماعی شرکت کنندگان می شود.
طرح های آزمایشی دارای محدودیت های زیادی می باشند. این طرح ها می تواند الف) مسائل اخلاقی خاصی را ایجاد نمایند، ب) اجرای درست آن ها بسیار دشوار باشد و ج) نمی توان از آنها برای برخی مداخلات خاص استفاده کرد.
در مثال کنونی که در اینجا مطرح شده است، یکی از مسایل اخلاقی در طرح آزمایشی کامل این است که ممکن است لازم باشد، افرادی که در معرض متغیر آزمایشی قرار می گیرند برای زمانی از خدمات اجتماعی که به آنها ارائه می شود، محروم شوند. این دست از محدودیت ها در مثال ذکر شده زیاد است. بنابراین امکان اعمال متغیر مستقل و دستکاری آن توسط پژوهشگر میسر نیست. تجربه های قبلی در استفاده از شیوه های آزمایشی کامل نشان می دهد که شکایات و به ثمر نرسیدن پژوهش، مخصوصا در مثال ذکر شده در اینجا، زیاد است. زمانی که چنین محدودیت هایی به وجود می آید؛ ممکن است بر انتخاب کامل تصادفی افراد به منظور گمارش در گروههای کنترل و آزمایش تاثیر بگذارد و علاوه بر معذوریت های اخلاقی ممنوعیت های حقوقی نیز برای برگزار کنندگان پژوهش ایجاد نماید.
مشکل دیگر طرح های تصادفی کامل عدم خلوص نتایج است. به خاطر مسائل اجرایی که در هر مطالعه ای روی می دهد، خالص سازی گروهها به لحاظ دریافت متغیر یا متغیرهای مستقل دشوار می شود. در مساله ی "عدم خلوص"، اعضای گروه کنترل در معرص تمامی و یا برخی از مداخلات اعضای گروه آزمایش، قرار می گیرند. یکی از این موارد در مثال مورد نظر در اینجا، دریافت سطوح مختلف متغیر مستقل از منابعی غیر از منابع پژوهش است. مطالعات آزمایشی همواره نمی توانند با موفقیت با چنین مسائلی برخورد کنند.
در طرح های آزمایشی لازم است هم اعضای گروه کنترل و هم اعضای گروه اصلی آزمایش قوانین را به خوبی درک کرده باشند. اگر شروط یا قوانین آزمایش به خوبی درک نشده باشد، ممکن است روی روایی درونی تاثیر بگذارد و نتوان از طرح های کاملا آزمایشی استفاده کرد. در این صورت باید نتایج به گونه ای تفسیر شود که طرح شبه آزمایشی است.
فرسایش، فرسودگی و افت نمونه تحقیق و عدم پاسخ آزمودنی ها یکی دیگر از مسائلی است که روی نتایج بدست آمده از طرح تحقیق آزمایشی کامل تاثیر می گذارد، اگر چه این موارد می تواند روی نتایج بدست آمده از تحقیقات شبه آزمایشی نیز تاثیر بگذارند؛ ولی تاثیر آنها در تحقیقات شبه آزمایشی کمتر است. زمانی که افت آزمودنی وجود دارد یا آزمودنی ها به سوالات پاسخ نمی دهند، نمونه بدست آمده معرف جامعه نخواهد بود-معرف بودن نمونه در طرح های آزمایشی یکی از مهمترین ویژگی های آن است-. مخصوصا این مساله زمانی بیشتر خود را نشان می دهد که در مطالعات روانشناسی افرادی که سوالات را پاسخ نمی دهند یا تا انتهای آزمایش همراه نیستند، در بیشتر موارد به لحاظ ویژگی های روانشناختی با یکدیگر یکسان و با گروهی که تا پایان پژوهش همراه اند، متفاوت می باشند و به این صورت یک خطای منظم در نمونه گیری ها اتفاق می افتد. در مثال مربوطه ممکن است افرادی که رضایت بیشتری از خدمات رفاه اجتماعی دارند اطلاعات و پیشینه خود را در اختیار ارزیاب ها قرار بدهند و افراد ناراضی به صورت سوداری این کار را کمتر انجام دهند و به بسیاری از سوالات پاسخ ندهند. در چنین شرایطی نتیجه گیری های علی که از طرح های آزمایشی می شود، به صورت جدی تر پژوهشگر را به خطا می اندازد. بنابراین زمانی که تفاوت بین افراد دارای افت و افراد حاضر در آزمایش به لحاظ ویژگی های موثر در مطالعه معنادار است، روایی درونی طرح آزمایش مورد تهدید است. اما از آنجا که در طرح های شبه آزمایشی نتیجه گیری ها با ملاحظات بیشتر و به صورت محافظه کار تر است، اثر خطای افت کمتر خواهد بود. لازم به ذکر است که تمامی مسائل اجرایی، در مورد مطالعات نیمه آزمایشی هم صادق است؛ اما از آنجا که نتیجه گیری ها در طرح های شبه آزمایشی و استدلال ها مبتنی بر روش ها و نمونه های مختلف است (یعنی مبتنی بر تکرار طرح شبه آزمایشی در گروهها یا به شیوه های مختلف است)، اثرات اجرایی گفته شده اثر کمتری دارد.
طرح های نیمه آزمایشی
در سال های گذشته، طرح های نیمه آزمایشی برای ارزیابی تعداد زیادی از مداخلات رفاه اجتماعی به کار گرفته شده اند. این سیاست ها عموما در بخش هایی مانند کمک هزینه مسکن، اصلاحات بیمه سلامت، مالیات درآمد منفی، و برنامه های استخدام و تعلیم بوده است.
طرح های نیمه آزمایشی
زمانی که انتخاب تصادفی ممکن یا مناسب نباشد، محققان اغلب از طرح های شبه آزمایشی استفاده می کنند. در مطالعات شبه آزمایشی، یک موقعیت یا وضعیت مقابل موقعیت آزمایشی ایجاد می شود. این موقعیت انتخاب گروه مقایسه است که اعضای آن تحت مداخله قرار نمی گیرند، ولی در سایر شرایط با گروه آزمایش یکسان می باشند یا سعی بر این است که یکسان باشند.
در مطالعات شبه آزمایشی مشارکت کنندگان در برنامه با افرادی که در برنامه رفاه اجتماعی شرکت نمی کنند، یعنی همان گروه شاهد، مقایسه می شوند. در مثال حاضر فرض بر این است که ویژگی های مشابهی بین دو گروه وجود دارد، یکی از این ویژگی ها در این مثال عبارتند از وضعیت مشابه اجتماعی و اقتصادی. با وجود این ممکن است که دو گروه در ویژگی های غیر قابل سنجش یا به سختی قابل سنجش، دارای تفاوت هایی باشند. برای مثال، آن هایی که به صورت داوطلبانه در یک برنامه آموزشی شرکت کرده اند، ممکن است ویژگی هایی داشته باشند که با افرادی که در برنامه آموزشی شرکت نکرده اند، تفاوت های معناداری در ویژگی های مورد سنجش داشته باشند. هر دو امکان را باید در تفسیر نتایج یک مطالعه شبه آزمایشی، مد نظر داشت. روش های آماری و یا روش های دیگر برای کنترل چنین "تاثیرات انتخابی" به کار می روند، اما موفقیت واقعی در استفاده از شیوه های ترکیبی است.
موسسه تحقیقات شهری در آمریکا از یک طرح شبه آزمایشی به منظور ارزیابی برنامه آموزش و استخدام ماساچوست استفاده کرد. در پایگاه داده ی ایجاد شده که حدود 17 هزار دریافت کننده داشت، نیمی از آن ها مشارکت کردند و نیمی دیگر تنها ثبت نام های اولیه را انجام دادند. افراد غیر مشارکت کننده به عنوان گروه مقایسه انتخاب شدند. در مورد بسیاری از ویژگی های قابل سنجش، شامل نژاد، جنسیت، سن، و ترکیب خانوادگی اطلاعات لازم از این دو گروه یکسان بود اما برخی از ویژگی ها، مثل انگیزه، برای آنها قابل سنجش نبود. بنابراین در نهایت نتایج همچنان غیر قطعی باقی مانده است. بسیاری از پژوهش های مبتنی بر روش های آنلاین متاثر از این منبع خطا خواهند بود. در نتیجه گیری از روش های شبه آزمایشی اطلاع از ویژگی های مربوط به پژوهش چه در گروه شاهد و چه در گروه آزمایش بسیار ضروری است.
همانطور که از این بحث حاضر برمی آید، مشکلی بزرگ طرح نیمه آزمایشی سوگیری انتخاب است. سوگیری انتخاب محصول فرآیندهایی است که ناشی ویژگی های افرادی است که در تحقیق شرکت می کنند و یا در پژوهش شرکت نمی کنند. تفاوت های سنجیده نشده در ویژگی های فردی، مثل میزان انگیزه، ممکن است بتواند نتایج متفاوت را توضیح دهد. انتخاب افراد برای گروههای مورد مطالعه در طرح های شبه آزمایشی از روش هایی که پژوهشگر برای انتخاب افراد استفاده می کند؛ متاثر می شود. شرکت کننده های داوطلب حتما دارای ویژگی هایی هستند که با افراد غیر داوطلب متمایز می شوند، اما بررسی این موضوع که ویژگی های مورد تمایز در مطالعه مورد نظر اهمیت دارند یا خیر، مساله دیگری است که خود نیازمند پژوهش بیشتر است. با اینکه تنوعی از تکنیک های آماری برای تصحیح سوگیری انتخابی وجود دارند، امکان شناخت قطعی مناسب ترین روش وجود ندارد. و از آنجام که این روش ها منجر به تخمین های متفاوتی می شوند، همواره عدم قطعیت در مورد یافته های مطالعات شبه آزمایشی وجود دارند. گری برتلس از موسسه بروکینگ این موضوع را گونه شرح می دهند:
"عدم قطعیت درباره حضور، مسیر، و بزرگی سوگیرهای انتخاب افراد در مطالعات شبه آزمایشی، اعتبار برآوردهای مبتنی بر این مطالعات را دشوار می سازد. البته برآوردهای بدست آمده از این طرح ها می تواند الهام بخش باشند. مخصوصا زمانی که نتایج حاصل از طرح های مختلف شبه آزمایشی در یک مسیر قرار دارند، می تواند مفید و قابل توجه باشد. اما اگر متخصصان بر اساس روش های آماری به نتایج بسیار متفاوتی برسند و یا اگر تخمین های موجود دارای سوگیری های کاملا مشخص باشند، سیاست گذاران و مدیران در مورد کارآمدی آن ها داری شک و تردید خواهند شد و از نتیجه گیری بر اساس آنها اعراض خواهند نمود."
در مورد برنامه های آزمایشی، همتاسازی هایی که در روش های شبه آزمایشی ضروری است، غیرالزامی می باشد. در این روش ها انتخاب تصادفی سبب یکسانی پراکندگی ویژگی های قابل مشاهده و غیر قابل مشاهده در گروههای کنترل و آزمایش می شود.
مطالعات آزمایشی در ارزیابی ها به عنوان روش های اولیه و مهم تلقی می شوند. با وجود این، دست یابی به شرایطی که بتوان از روش های آزمایشی در مواردی مانند آنچه در اینجا ذکر شد (یعنی شرایطی که موضوعات اجتماعی یا روانشناسی اجتماعی را در بر می گیرد) استفاده کرد، نادر است. حوزه ی کابرد روش های آزمایشی کامل به موضوعات خاصی محدود می شود و برای بیشتر موقعیت های پژوهشی، پژوهشگر لاجرم باید از روش های شبه آزمایشی استفاده کند، هر چند نتیجه گیری های حاصل از مطالعات شبه آزمایشی نیازمند ملاحظه بیشتری است. با وجود این اگر پژوهشگر می خواهد در حوزه ای که امکان انجام مطالعات آزمایشی میسر نیست، دست به تبین های علی بزند، لازم است مطالعات شبه آزمایشی را روی گروههای مختلف و به روش های مختلف انجام دهد تا به ماتریسی مانند ماتریس کمپل و فیسک دست یابد، تا از طریق کلیت نتایج بدست آمده بتواند روابط علی را مشخص سازد. بنابراین، در بسیاری شرایط، یک طرح شبه آزمایشی رویکرد ارجح است. با اینکه همانند طرح های آزمایشی خالی از اشکال نیست، ولی می تواند اطلاعات مهمی را درباره برنامه ها و سیاست گذاری های جدید ارائه دهد.

 نویسنده: لیلا بهنیا (دانشجوی دکتری رشته روانشناسی)

R نرم افزاری برای تحلیل داده ها در تمام شاخه های علمی

فکر می کنم نامنصفانه باشد که بنیان گذاران R نتیجه زحمات خود را به رایگان در اختیار تمام افراد دنیا گذاشته باشند ولی کسانی که از این نرم افزار استفاده می کنند، از معرفی آن به سایرین دریغ کنند. 

زماني كه پژوهشگری براي رسيدن به اهداف علمي خود تلاش می نمايد به منظور دستیابی به نتایج روا و قابل دفاع، لازم است فعاليت هايش بر پايه ي روش هاي علمي درست و مناسب بنا شود و همانطور که کرلینجر می گوید باید بتواند مسیر علمی خود را شخصا ترسیم نماید و به جزئیات آنچه در پژوهشش می گذرد آشنا باشد. یکی از بخش های مهم هر پژوهش علمی (چه کیفی و چه کمی) تحلیل اطلاعات یا دیتا است. در حوزه ي تحليل داده ها و استخراج اطلاعات از داده ها روش هاي مختلف و پيشرفته اي وجود دارد كه هر كدام مزيت ها و محدوديت هاي خاص خود را دارند. امروزه تمام تحليل هاي آماري در شركت ها و موسسات با نرم افزارها انجام مي شود. بنابراين ضروري است نرم افزاري براي تحليل داده ها انتخاب شود كه معقول و مقبول جامعه ي علمي باشد. شاید در جامعه ی علمی ما این نکته جا افتاده باشد که می توان به خروجی نرم افزارها اعتماد نمود. اما با مرور تاریخچه ی نرم افزارهای آماری در می یابیم که گاهی روش های بکار گرفته شده در آنها مقبول جامعه ی علمی نیست. مثلا شرکت SPSS قبل از این که به IBM بپیوندد به دلیل بکار بردن روش های نامناسب در تحلیل های خود (تحلیل عاملی) یکبار در دادگاه آمریکا به پرداخت جریمه محکوم شده است. براي تحليل داده هاي آماري  نرم افزارهاي مختلفي وجود دارد از صفحه گسترده هايي مانند اكسل،سيستم هاي مبتني بر GUI كه نقطه كليك مي باشند )مانند SPSS) گرفته تا سيستم هاي داده كاوي و نرم افزارهاي مبتني بر روش گروهي مانند SAS. 

 مطالب ذیل از مقاله Ashlee Vance به آدرس:

http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html

گرفته شده است.

برای بعضی ها R فقط 18همین حرف الفبای انگلیسی است. برای برخی دیگر R یک رتبه (درجه دسته بندی) در فیلم­های مهیج است. برای برخی ها نیز یک درجه عایق استفاده شده برای اتاق زیر شیروانی و یا حرفی هست که دزدان دریایی در فیلم ها می­گویند.

R همچنین نام یک زبان برنامه نویسی و نرم­افزار مهم و کاربرپسند است که برای آنالیز داده­ ها استفاده می­ شود. این برنامه در حال تبدیل شدن به یک زبان برنامه نویسی بین المللی است. چرا که امروز داده کاوی یکی از کارهای اجتناب ناپذیر هر علمی شده است. امروزه شرکت های مختلف از جمله Google, Pfizer, Merck, Bank of America, the InterContinental Hotels Group و Shell از آن به صورت روزمره استفاده می­کنند.

اما شاید این سوال برای شما پیش بیاید چرا این برنامه را R نامیده اند؟ این سوالی است که برای خودم هم پیش آمده اما فقط همین را میتوانم بگویم که R اولین بار در سال 1996 ظهور یافت که دو پروفسور آمار نیوزلندی به نام های Robert Gentleman و Ross Ihaka یک کد برنامه نویسی را به همراه نرم افزار به صورت رایگان منتشر کردند. شاید دلیل نامگذاری R به خاطر حرف اول اسم کوچک این دو پرفسور آمار باشد.

یک محقق در شرکت Google که از نرم افزار R استفاده می کند گفته نرم ­افزار R آنقدر مهم است که ارزش آن قابل شمردن نیست. این نرم افزار به محققان و دانشجویان این اجازه را می دهد که آنالیزهای پیچیده و برهمکنشی را بدون اینکه از پس زمینه نرم افزار و روش های آماری اطلاعی داشته باشد را انجام دهند.

جالب اینکه این نرم افزار مجانی است. این قابلیت را دارد که کدهای خود را که در زبان برنامه نویسی مانند C++ نوشته ای را در اینجا برای محققان دیگر به اشتراک بگذاری، کدهای نوشته شده را اصلاح کنید و از بسته های نرم افزاری دیگران استفاده کنی. پس هم یک زبان برنامه نویسی است و هم یک بسته نرم­افزاری برای کاربران می باشد. خیلی اوقات محققان آماری در زمینه برنامه نویسی به توابع و الگوریتم های نیاز دارند که نوشتن آنها به زمان بسیار زیادی نیاز دارد. اما با استفاده از R کاربر میتواند به راحتی از متدها و توابعی که دیگران نوشته اند استفاده کند. برخی از کاربران R آن را به عنوان یک نسخه پیشرفته excel می داند زیرا به راحتی میتواند ویرایش و آنالیزهای دادها را با آن انجام داد.

در حال حاضر بیش از 3117 بسته نرم افزاری برای R نوشته شده است. واقعیتش من فکر نمی کنم تا حالا هیچ نرم­ افزاری به این گستردگی نوشته شده باشد. برخی از دانشجویان به من گفته اند که این نرم افزار به زودی جایگزین SAS می شود. اما باید بگم SAS که چه عرض کنم، دیگر نرم افزارهای برآورد پارامتر هم دارند کنار میروند. فقط بگم این نرم افزار واقعاً محشر است، هر چه دلت بخواد توی آن پیدا میکنی. بعضی ها میگن شبیه نرم­افزار Matlab است. از این جنبه که قابلیت نوشتن برنامه در ان هست بله. مثل Matlab است. اما شما برید ببینید آیا میتوانید به نرم افزار Matlab فایل شجره و داده را بدی برایتون BV یا پارامتر ژنتیکی محاسبه کنه. برای اینکار در نرم افزار Matlab مجبور بودید صدها خط برنامه مینوشتید اما با R همین کار را با 10 خط میتونید انجام بدید.

اینکه تعداد کاربران نرم افزار R چقدر است را نمی توان دقیق گفت اما در سال 2009 حدود 250000 نفر تخمین زده شد. که من شک ندارم تا امروز این تعداد از 500000 نفر هم گذشته است. همچنین در این مقاله نوشته شده کاربرپسندی و قابلیت های دیگر R میتواند تجارت موسسئسه هایی که SAS را سازماندهی می کننند تهدید کند که قطعاً همینطور هست. مثل خود من، از زمانی که با R آشنا شده ام خیلی کمتر از SAS استفاده میکنم. البته شرکتی که SAS را نوشته و پخش می کند هم بیکار ننشسته و امروز SAS نسخه 9.2 با قابلیت بالاتر و با کتابهای راهنمای بسیار باکیفیتی را وارد بازار کرده است.

بااین وجود R یکسری نقایصی هم دارد که قطعاً به زودی حل خواهند شد. یکی از آنها این است که برای برخی packageها و متدها به حافظه کامپیوتری بالایی نیاز دارد. برخی از packageهای آن روی برخی سیستم عامل ها جواب نمی دهند مثلاً package MCMCGlmm گاهی اوقات روی ویندوز 7 کار نمی کند باید حتماً از XP یا لینوکس استفاده شود. از نظر حافظه محدودیت دارد. سرعت ان نسبتاً کند است. اما همچنان تهیه کنندگان این نرم افزار در تلاشند تا کاستی های آن را جبران کنند. که قطعاً به زودی این کاستی ها را نیز برطرف خواهند کرد.

منبع: http://geneticz.blogfa.com/post-129.aspx

همانطور که در ابتدا گفته شد مقاله ترجمه شده مربوط به سال 2009 است. در حال حاضر تمام مشکلات ذکر شده در نرم افزار آر حل شده است. به صورت نسبی به لحاظ سرعت در اجرای الگوریتم های مختلف نرم افزار آر گوی سبقت را از سایر نرم افزارها ربوده است، بهترین قدرت و قابلیت گرافیکی را دارد و تعداد بسته های آن حدودا دو برابر شده است. تعداد کاربران فوق العاده چشمگیر و تعداد وب لاگ ها و سایت های آموزشی آن نسبت به تمام نرم افزارهای تحلیل داده با سابقه های طولانی تر، بیشتر شده است. شتاب گسترش آر به گونه ای است که بعضی از تحلیل گران به آن گوگل تحلیل داده می گویند.

موارد ذیل از لینک

 http://measurement.blogfa.com/post-865.aspx    گرفته شده است

 

 

دلایل استفاده از نرم افزار R

 

در بين نرم افزارهاي مختلف براي تحليل هاي آماري و سنجشي بهتر است از نرم افزار R استفاده شود. دلايلي كه اين نرم افزار را از ساير نرم افزارها جدا مي سازد در زیر ارائه شده اند.

 

1.اين نرم افزار رايگان است: مي دانيم كه بيشتر نرم افزارهايي كه در كشور استفاده مي شوند نرم افزارهايي هستند كه نسخه ي اصلي آنها نيست و نسخه هاي قفل شکسته،  نرم افزارها قابل اطمینانی نمی باشند. اين موضوع در کشور ما چندان مورد توجه پژوهشگران قرار نمی گیرد. نرم افزار R علاوه بر اين كه رايگان است از طریق اینترنت و سایت اصلی آن یعنی www.r-project.org قابل دانلود است. 

 

2.دانلود نسخه ي اوليه ي اين نرم افزار بسيار آسان و كم حجم است و تنها بسته هاي ضروري را همراه دارد پژوهشگر مي تواند بر اساس نيازي كه به ساير بسته ها دارد آنها را جداگانه دانلود كند و نصب نمايد. 

 

3.نرم افزار R يك پروژه ي منبع آزاد است كه هر كس مي تواند كدهاي مختلف را بررسي كرده و آنها را سرهم نمايد و يك بسته ي نرم افزاري جديد ارائه دهد كه هم خود از آن بهره برد و هم در اختيار سايرين در سراسر دنيا قرار دهد.

 

4. R يك زبان برنامه نویسی است. زبان برنامه نویسی که برای انجام تحلیل های آماری و گرافیکی تدوین شده است. در این نرم افزار دستورات باید نوشته شوند. زماني كه از نوشتن دستورات صحبت مي شود به نظر كار مشكلي پيش رو است اما كار با اين نرم افزار بسيار راحت بوده و فراگيري آن مخصوصا زمانی که فرد با اصول اولیه ی آن آشنا باشد، به سرعت انجام مي شود. 

 

5. یکی از مزایای اصلی کار با نرم افزار آر این است که پژوهشگر شخصا در فرايند تحليل قرار می گیرد كه منجر به تقويت فهم آماري وي مي شود و مانند ساير نرم افزارها، تحليل ها در جعبه سياه انجام نمی شود. به بيان ديگر اين نرم افزار سبب كاهش فاصله ي بين آمار و برنامه نویسی آماری می شود. 

 

6. نرم افزار R مي تواند به عنوان منبعي براي تدريس و آموزش استفاده شود. نرم افزار R به دلیل قابلیت های برنامه نویسی آن می تواند مانند نرم افزار اکسل منبعی برای یادگیری و آموزش موضوعات مختلف آماری و روش شناسی علمی باشد.

 

7. از طريق نرم افزار R مي توان كليه ي تحليل هاي آماري را در هر رشته علمی انجام داد. به دليل باز بودن منبع اين نرم افزار، هر روزه افراد در اقصی نقاط دنیا بر اساس نياز خود بسته هاي نرم افزاري جديد تهيه كرده و در اختيار سايرين قرار مي دهند. تا كنون بالغ بر 5000 بسته ي نرم افزاري مختلف براي اين نرم افزار توليد شده است. 

 

8. كاربران روز افزون اين نرم افزار دست به ايجاد وب لاگ ها و وب سايت هاي مختلف زده اند تا از اين طريق بسته هاي مختلف را معرفي كرده و به سوالات سايرين پاسخ دهند، بنابراين در صورت برخورد با مشكل مي توان از اين منابع استفاده نمود و یا مشکل خود را با سایرین در میان گذاشت.

 

9. انعطاف پذيري نرم افزار R: اين نرم افزار به اين دليل كه يك زبان برنامه نويسي است مي تواند تحليل ها را بر اساس نياز و مطابق دلخواه پژوهشگر تغییر دهد. تحليل ها از كشيدن نمودارهاي ستوني و پراكنش تا روش هاي پيشرفته مانند مدلهاي پيش بيني و يادگيري ماشين را در بر مي گيرد. 

 

10. قدرت گرافيكي ديداري سازي بالاي نرم افزار R: گرافيك و ديداري سازي داده ها که به عنوان قسمت ضروري فرآيند تحليل بشمار می رود يكي از اصول طراحي نرم افزار است. سيستم گرافيكي نرم افزار متاثر از تفكر رهبران ديداري سازي داده ها مانند بيل كلوند و ادوارد توفت است. 

 

11. استفاده از آن در نوشتن مقالات در مجامع علمي دنيا قابل قبول است. بعضي از نشريات ممكن است تحليل هاي انجام شده توسط نرم افزارهاي خاصي را قبول نداشته باشند ولي انجام تحليل ها از طريق اين نرم افزار در تمام دنيا قابل قبول است.

 

12. ارائه ي خروجي هاي به صورت عكس هاي با كيفيت عالي براي گراف ها و نمودارها و خروجي هاي دقيق براي تحليل هاي آماري غير گرافيكي.

 

13. انتقال فايل ها از نرم افزارهاي مختلف و پذيريش پسوند هاي كاربردي.

 

14. Copyو paste راحت فرمان ها خروجي ها و دادها.

 

15. قابلیت استفاده از نرم افزار در تمام حوزه های علمی. این نرم افزار می تواند به طور کاملا اختصاصی در تمام رشته های علمی استفاده شود. فراگیری این نرم افزار کاربر را از فراگیری نرم افزارهای دیگر بی نیاز می سازد. به عنوان مثال نرم افزار spss توانایی تحلیل های SEM و Path analysis را ندارد برای انجام این تحلیل ها لازم است کاربر نرم افزارهای دیگری مانند R را فراگیرد. مثلا کسی که در رشته سنجش و اندازه گیری تحصیل می کند در صورتی که از نرم افزار spss استفاده کند لازم است از نرم افزارهای LIZREL,AMOS,TESTFACT,BILOG,MULTILOG,PARSCALE,SAS,STATISTICA  و موارد دیگر استفاده نماید. اما با فراگرفتن کار بانرم افزار آر، از فراگیری سایر نرم افزارها رها می شود. بنابراین هزینه زمانی و مالی بسیار کمتری متحمل می شود.

16. یادگیری زبان برنامه نویسی آن به دلیل سطح بالا بودن زبان R ، نسبت به هر زبان دیگری راحت تر است. 

17. از دید مجلات معتبر دنیا (مانند ساینس و نیچر) در رشته های مختلف قابل اعتماد است و به دلیل رایگان بودن برای درج مقالات در این مجلات نیاز به لایسنس ندارد. 

 

 

 

علیت چیست و در بستر علوم رفتاری (روش شناسی و تکنیک) چگونه حاصل می شود؟

چکیده: مطالب مربوط به استنباط های علی در متون فلسفی، آماری و علوم رفتاری و اجتماعی پراکندگی بسیار چشمگیری دارند. اما تلاش می شود تا به صورت مختصر به آن پرداخته شود. برای پاسخ به سوال، علیت از منظر فلسفه به عنوان پیش نیاز پاسخ به سوال، عنوان نظریات علیت، پیش فرض های وجود رابطه علی و علیت در روش شناسی، مطرح شده است. علیت در روش شناسی نیز به علیت در مطالعات آزمایشی و غیر آزمایشی تقسیم شده و به تفکیک مورد بررسی قرار گرفته است.

علیت در فلسفه: موضوع علیت در فلسفه قدیم، جزء مباحث متافیزیک بوده است و متافیزیک خود بخشی از فلسفه نظری به حساب می آمد. متافیزیک در فلسفه یعنی قواعد کلی وجود. یعنی قواعدی که به طور عام در عالم وجود، حاکم اند. به دلیل پیچیدگی موضوع علیت در فلسفه است که آن را جزء قواعد کلی و در حوزه ی متافیزیک قرار می دهند. در فلسفه جدید نیز علیت جایگاه اثباتی ندارد. به عنوان مثال، کانت می‌گوید: «تصور علیت را که همه ما دائماً به کار می‌بریم، ممکن است تجربه پیشنهاد کرده باشد، اما این معنا ثابت نمی‌کند که مأخوذ از تجربه است. بنابراین بیشتر به عنوان یک اصل موضوعه پذیرفته می شود. اصلی که مطرح می کند هر معلولی دارای علتی است. از این منظر علیت در حوزه ی بررسی علم قرار نمی گیرد. مثلا دیوید هیوم هیچ‌گونه مبداء فراتجربی در باب شناخت را به رسمیت نمی‌شناسند و براین ‌اساس تصور علیت را نیز دارای خاستگاه تجربی می‌داند، تا بتواند آن را به حوزه علم وارد نماید. با وجود این می توان پذیرفت که تفکر علی کاملا به سطح نظری تعلق دارند و قوانین علی را هرگز نمی توان به صورت تجربی اثبات کرد. اما این بدان معنا نیست که تفکر علی و یا ساختن الگوهای علی که استلزام های ناشی از آنها را می توان به طور غیر مستقیم آزمود، کار بیهوده ای است.

برای پاسخ به سوال لازم است بعضی از مفروضات ساده کننده که آزمون پذیر نیستند؛ را پذیرفت. باید قبول کرد که واقعیت، یا دست کم تلقی ما از واقعیت، شامل فرآیندهای در جریان است. هیچ دو واقعه ای هرگز عینا تکرار یکدیگر نیستند، هیچ شیء یا چیزی نیست که از این لحظه تا لحظه بعد دقیقا بر یک حال باقی بماند. با این وجود، این موضوع را باید فرض گرفت که اگر ماهیت جهان قابل شناسایی باشد، باید چنان اندیشید و عمل کرد که گویی واقعه ها تکرارپذیرند و اشیا خصیصه ای دارند که می توانند بنابر آن برای مدتی، هر چند کوتاه ثابت بمانند. تنها اگر به خود اجازه ی قبول چنین مفروضات ساده ای را بدهیم می توانیم از واقعه ی منحصر به فرد و واجد فراتر رویم و دست به تعمیم بزنیم و در مورد علیت صحبت نماییم. این پیش فرض در مورد تمام نظریات علیت صادق است.

نظریات علیت عبارتند از:

  1. نظریات خلاف
  2. نظریات علت و معلولی احتمالاتی
  3. نظریات حساب علی (این نظریه پایه ی روش های آماری مانند شبکه های بیزی و گراف ها در نتیجه گیری های علی است)
  4. یادگیری ساختار (این نظریه پایه ی روش های آماری مانند همبستگی ها، رگرسیون ها، تحلیل مسیر و مدل معادلات ساختاری، سری های زمانی، همبستگی های متقاطع و داده های بخش بندی های متقاطع، در برداشت های علی است)
  5. نظریه اشتقاق
  6. نظریات دستکاری (اساس نتیجه گیری های علی در مطالعات آزمایشی این نظریه است).
  7. نظریات فرآیندی (اساس نتیجه گیری های علی در روش های آماری سلسله مراتبی مانند HLM ها این نظریه است).
  8. نظریات علیت سیستماتیک

بر اساس نظریات مربوط به علیت، مدل های مختلف علی ظهور پیدا می کنند. موضوعاتی که در ادامه مطرح می شود، هر کدام ریشه در یکی از این نظریات بنیادی دارد.

شرایط وجود یک رابطه علی

رابطه علیت بین پدیده ها (events)  رفتارها (properties) متغیرها (variables)  یا حالت های متفاوت امور (affairs)  مشاهده  می شود.  اما نمی توان هر نوع رابطه بین دو شی یا دو پدیده را به راحتی رابطه علیت نامید. بلکه رابطه علت – معلولی، دارای ویزگی های خاصی است که در ذیل ارائه شده اند:

  1. تقدم علت برمفعول (causal precedence) بدین معنا که علت از نظر زمانی باید مقدم بر معلول خود  باشد،  یا دست کم همزمان با آن به وقوع پیوندد، در غیر اینصورت نمی توان رابطه بین دو پدیده را رابطه علت -معلولی خواند . مثلا  خارج شدن گلوله از لوله تفنگ نمی تواند علت انفجار باروت در ته  فشنگ باشد ، بلکه بر عکس، انفجار باروت می تواند موجب پرتاب شدن گلوله باشد. البته این تقدم و تاخر در زمانی که موضوع مورد مطالعه انسان است، رعایت نمی شود. به عنوان مثال در روانشناسی افراد بر اساس انگیزه هایشان قبل از انجام کاری مقدماتی برایش ایجاد می کنند. در واقع علت انجام چنین مقدماتی واقعه ای است که می خواهد در آینده اتفاق بیفتد. مثلا برای قبولی در کنکور از یک سال قبل مطالعه می کند.
  2.  رابط ضروری ( necessary connection)  بین علت و معلول، دومین ویژگی رابطه علیت است.  هر جا علت بوجود بیاید ، معلول آن نیز بوجود خواهد آمد.  مثلا «آب در 100 درجه سیلیسیوس در فشار یک اتمسفر به جوش می آید »  هرگاه به آب در تحت شرایط گفته شده حرارت بدهیم، به جوش خواهد آمد.
  3. نزدیکی و مجاورت (contiguity of cause and effect ) : بدین معنا که علت و معلول باید از نظر زمانی و مکانی بهم نزدیک و در یک فضای عقلایی باشند. مثلا، نمی توان  گفت علت یخ بستن آب  داخل لیوان که دیشب بیرون از اتاق بوده است، سرمای قطب شمال است. بلکه برودت هوا شب هنگام افت کرده و علت یخ بستن آب داخل لیوان شده است. رابطه سرد بودن هوای منطقه و یخ بستن آب از نظر تجربه قابل قبول است .
  4. علت های یکسان دارای  معلول های یکسان  ( برابر ) هستند.
  5. علت های معین دارای معلول های معین هستند و برعکس.
  6. هر گاه علتی تغییر یابد ( یا علت متفاوتی جایگزین آ ن گردد ) معلول مربوط نیز تغییر خواهد کرد.

علیت در روش شناسی

علیت در روش شناسی روانشناسی را می توان به طور کلی در دو دسته طبقه بندی نمود. استنباط های علی در پژوهش های آزمایشی و استنباط های علی در پژوهش های غیر آزمایشی. شرایط و الزامات هر کدام از این روش ها در زیر ارائه می شود.

استنباط علی در طرح های آزمایشی

منطق طرح های آزمایشی، منطقی است که به خوبی قابل درک است. آزمایشگر می تواند با دخل و تصرفهایی دقیق تاثیرات جداگانه اما همزمان چند متغیر مستقل بر یک متغیر وابسته را از یکدیگر متمایز کند. به روش های مختلف مانند انتخاب تصادفی، آزمایش کننده می تواند اثرات مزاحم را که غیر سنجشی و یا ناشناخته اند بر فرض درستی قواعد احتمالاتی حذف نماید. البته در مورد بعضی از متغیرهای تهدید کننده انتخاب تصادفی راه حل مناسبی نمی تواند باشد و قابلیت کنترل آنها وجود ندارد. در هر صورت اگر آزمایشی خوب طراحی شده باشد به محقق اجازه داده می شود که با استفاده از تعداد نسبتا کمی از مفروضات ساده کننده، و کاملا موجه و منطبق بر شهود، آزمایش را انجام دهد و آن گاه بر پایه نتایج و با درجه ای از اطمینان، دست به استنباط های علی بزند. البته باید خاطر نشان کرد که ماهیت شواهد تجربی هر چه باشد، هرگز نمی توان وجود علیت را خالی از شبهه دانست.

در پژوهش های آزمایشگاهی فرض بر این است که همانطور که در جهان واقعی بعضی از عوامل موجب می شوند که تغیراتی در یک نظام بوجود آورند، در آزمایشگاه نیز می توان همین کار را انجام داد. در آزمایشگاه پژوهشگر به عنوان عامل اصلی ظاهر می شود. در واقع اگر x علت y باشد به شرط این که سایر علت های y ثابت نگه داشته شود، باید دخل و تصرف آزمایشی در متغیر مستقل x (یعنی ایجاد تغییری در x از خارج) با مشاهده تغییری در y همراه باشد. تغییر در y نباید پیش از تغیری در x روی دهد و گرنه نمی توان استنباط کرد که متغیر y به متغیر x وابستگی علی داشته باشد. مفهوم علیت در پژوهش های آزمایشی، متضمن آن است که در صورت ثابت بودن سایر متغیرهای علی، چنانچه x تغیر کند y نیز تغیر کند. اما با توجه به این حقیقت که در زندگی واقعی هرگز نمی توان معلوم کرد که متغیرها ثابتند یا نه، صرفا نمی توان با مشاهده این که دخل و تصرف در x تغییری در y را به همراه دارد، استنباط کرد که x علت y است. به عبارت دیگر در حالی که مایلیم تصور کنیم که چیزی موجب تغیر در y شده است اما یقین نداریم که این چیز همان دخل و تصرف در x است یا نه.

به پیروی از کیش متغیرهایی که می تواند سبب تغیراتی در y شوند را در چهار دسته قرار می دهیم تا بتوانیم درک درستی از برداشت های علی در پژوهش های آزمایشی داشته باشیم. نخست متغیرهای مستقل اند که پژوهشگر می کوشد تا در آن ها دخل تصرف نماید. دوم، شاید برخی متغیرهای بالقوه باشند که علت های y اند ولی در موقعیت آزمایشی تغییری نمی کنند. پژوهشگر آزمایشی، ممکن است از وجود برخی از آنها اطلاع داشته باشد و آنها را تحت کنترل قرار دهد. شاید متغیرهای ناشناخته ای هم وجود داشته باشند که در شرایط آزمایش تغییری نکنند و بنابراین نتوان در تغیرات y سهمی را برای آنها در نظر گرفت (چون در غالب تحلیل های آزمایشی منظور از تغییر، تحلیل تغییرات یا همان تحلیل واریانس است). سومین گروه شامل تمام متغیرهایی است که کنترل نمی شوند و ضمن آزمایش بی گمان تغیراتی در y بوجود می آورند، اما تاثیراتشان بر y به تاثیرات x، یعنی متغیر مورد بررسی ارتباطی ندارد. گروه چهارم را متغیرهای مشتبه کننده تشکیل می دهند که تاثیراتشان به گونه ای منظم به تاثیرات متغیر مستقل مربوط می شود و بنابراین آثار ناشی از این متغیرها با اثرهای x اشتباه می شوند. از جمله دلایل اشتباه این است که شاید یکی از این متغیرها علت مشترک x و y باشد. آنچه تاثیر مستقیم x و y در نظر گرفته می شود ما حصل هم خطی بین متغیرها است که در اثر متغیر سومی بوجود آمده است. شاید هم آزمایشگر در حین دخل و تصرف در x به صورت ناخواسته در متغیر سوم هم دخل و تصرف نماید.

در یک آزمایش ایده آل و آرمانی متغیرهای نوع سوم و چهارم وجود ندارد و احتمالا هر گونه تغیر در متغیر y را می توان به x ارتباط داد. البته وضعیت خطاهای اندازه گیری به عنوان یکی از عوامل ایجاد کننده ی تغیر را می توان این گونه توضیح داد که تغیرات اندازه گیری شده در y نه تنها به سبب تغیرات واقعی y، بلکه شاید هم بر اثر عوامل چون وضعیت جسمانی مشاهده گر نسبت داد. این خطاها در شرایط عملی تصادفی در نظر گرفته می شوند. البته در آزمایش ایده آل این گونه خطاها نیز صفر در نظر گرفته می شوند.

هدف از آزمون های معناداری مانند آزمون تحلیل واریانس، صدور مجوز برای استنباط هایی در مورد تاثیرات متغیر مستقل x در مقایسه با تاثیرات متغیرهای نوع سوم است که تغیراتی در y پدید می آورند که به مقادیر x ربطی ندارند. اگر چه آزمون های معناداری کاری به وجود یا عدم وجود متغیرهای گروه چهارم ندارند، ولی نمی توان از این آزمون ها به منظور حذف تاثیرات مزاحم چنان متغیرهایی استفاده کرد.

البته با توجه به این که از الزامات آزمایش انتخاب تصادفی است، انتظار می رود که متغیرهای نوع چهارم به متغیرهای نوع سوم تبدیل شوند. یعنی به متغیرهایی تبدیل شوند که تاثیرشان مستقل از تاثیرات متغیر آزمایشی مورد نظر است.

در استنباط های علی مبتنی بر روش های آزمایشی به هیچ وجه نباید استفاده از متغیرهای کنترل، انتخاب تصادفی و آزمون های معناداری را به منزله ی روش های جایگزین یکدیگر در نظر گرفت. بلکه کمال مطلوب آن است که از همه ی آنها در استنباط های علی در روش های آزمایشی استفاده شود. پژوهشگر آزمایشی تمام تلاش خود را به خرج می دهد تا اثر متغیرهای دیگر را کنترل کند. به عبارت دیگر تا می تواند متغیرهای نوع سوم و چهارم را به متغیرهای نوع دوم تبدیل کند. سپس برای آن که از گزینش شخصی پرهیز کند، افراد را به صورت تصادفی در گروهها می گمارد و آنها را در معرض متغیرهای آزمایشی قرار می دهد. این امر باعث کاهش متغیرهای مشتبه کننده می شود. سر انجام با توجه به این که همواره ممکن است حداقل چند متغیر از نوع سوم باقی مانده باشد که کنترل نشده اند، دست به آزمون های معناداری می زند.

استنباط های علی در مطالعات غیر آزمایشی

زمانی که هدف یک مطالعه ی غیر آزمایشی است، پژوهشگر با داده هایی کار می کند که نتیجه گیری علی از آنها به مراتب پیچیده تر از مطالعات آزمایشی است؛ چرا که در چنین مطالعاتی انبوهی از متغیرهای خارجی بر آن اثر می گذارند. در چنین وضعیتی نه تنها به سختی می توان بسیاری از متغیرها را که به وسیله انتخاب تصادفی  حذف کرد؛ بلکه اصولا پژوهشگر درباره توالی زمانی آنها نیز اطلاعات کافی در اختیار ندارد. این موضوع در مورد مطالعات غیر آزمایشی که اطلاعات در یک زمان واحد جمع آوری می شود، حادتر است. در این گونه موارد، نیز نباید حکم قطعی مبنی بر عدم وجود رابطه ی علی داد. همبستگی های بدست آمده نمی تواند جایگزین رابطه ی علیت آزمایشی شود، اما وقتی پاره ای از اطلاعات ضروری وجود ندارد، پژوهشگر ناچار است بر تعدادی از مفروضات ساده کننده خود بیافزاید. مشخص است که در این حالت ممکن است مفروضات اضافه شده مقبولیت کمتری نسبت به شرایط آرمانی آزمایشی داشته باشد. درست است که در استنباط های علی به مقدار زیادی خطر اشتباه وجود دارد، اما این بدان معنا نیست که بگوییم اصلا نباید دست به چنین استنباط هایی زد. گسترش نظریه و آزمون آن در روانشناسی در گروه دست یافتن به استنباط های علی است.

زمانی که پژوهش های غیر آزمایشی بر نظریه تکیه می زنند، پایه ای را می سازند که امکان برداشت های علی را برای پژوهشگر مهیا می سازد. روش آماری پژوهش های غیر آزمایشی، رگرسیون است. بسیاری از روش های غیر آزمایشی با هدف مطالعه ی علیت گونه ای از روش های رگرسیونی اند. مانند رگرسیون های چند گانه و چند متغیری، مدل معادلات ساختاری و تحلیل مسیر. ضرایب مسیر که خصوصیات ضرایب همبستگی و رگرسیون را یکجا در خود دارند، پژوهشگر را قادر می سازد که سهم نسبی عامل معینی را در همبستگی بین دو متغیر دیگر برآورد کند. به هر شکل استفاده از روش های آماری علیت وقتی میسر است که  نظریه خوبی پرورانده شده باشد.

علاوه بر مورد گفته شده در بالا، کمپبل و همکارانش در خصوص تعدادی از روش های شبه آزمایشی کار کرده اند که هرگاه انتخاب تصادفی مقدور نباشد، ولی توالی های زمانی قابل تشخیص یا قابل استنباط باشند، بتوان از آنها استفاده کرد. یکی از این روش ها که مفهوم علیت را می رساند، روش تاخیر متقاطع (متقاطع تاخیری) است. در این روش به منظور استنباط جهت علیت، شدت نسبی همبستگی های بین دو متغیر در زمان های متفاوت با یکدیگر مقایسه می شود. خلاصه این که اگر همبستگی بین متغیر علت در زمان 2 و متغیر معلول در زمان 1 بیشتر از همبستگی بین متغیر معلول در زمان 2 و متغیر علت در زمان 1 باشد، می توان از رابطه ی بین متغیرها، برداشت علی داشت. بدیهی است که استفاده از چنین روشی در علیت نیازمند مفروضات ساده کننده درباره عوامل خطاست. به نظر می رسد بهترین موقع برای بکار بستن این روش ها در استنباط های علی زمانی است که تاخیر زمانی بین علت و معلول با فواصل زمان های اندازه گیری یکسان باشد.

بر این اساس می توان زنجیره ای را به منظور تحلیل های علی در مطالعات غیر آزمایشی ارائه داد:

  1. به شرطی که یک مقیاس تک بعد در دست باشد، و نمونه ای تقریبا بزرگ مثلا 150 تا 200 نفر داشته باشیم، می توان با داده ها چنان رفتار کرد که گویی مقیاس مورد استفاده از نوع فاصله ای است و سپس ضرایب همبستگی و رگرسیون را به دست آورد. آنگاه بر طبق روش هایی که جنبه احتیاط آمیز بیشتری دارند به تحلیل داده ها پرداخت و نتایج حاصل از دو روش را با یکدیگر مقایسه کرد.
  2. با استفاده از بهترین دانش نظری موجود، تعدادی مدل جانشین ساخته شود.
  3. روابط غیر خطی و روابط جمع ناپذیر توسط پژوهشگر مشخص شود. در صورت وجود هر کدام سعی شود، روابط به روابط خطی جمع پذیر تبدیل شوند. هر جا که ظاهرا تعامل های بی قاعده وجود دارد به جستجوی تاثیرات مزاحم متغیرهای خارجی پرداخته شود. اگر تعامل ها بی قاعده و شدید باشند، پژوهشگر مجبور است کار تحلیل را متوقف کند. در پاره ای از مواقع احتمالا می توان زیر نمونه هایی یافت که در آنها هیچ تعاملی رخ نمی دهد یابرای آنها الگوهای علی متفاوتی مناسبت دارند.
  4. پژوهشگر باید به دنبال تاثیرات شبه انگیزی باشد که درون الگو جای داده نشده اند ولی می توان به گونه ای موجه انتظار عمل از آنها داشت. باید سعی کرد تاثیرات شبه انگیز را شناخت و به الگو یا مدل مورد بررسی اضافه کرد.
  5. پژوهشگر می تواند، تاثیرات شبه انگیز و خطاهای اندازه گیری را به وسیله ی روش های مختلف و با مطالعه ی روند از میان بردارد.
  6. هر جا که امکان تغیر در واحدهای تحلیل و یا تغیراتی در طرح تحقیق وجود داشته باشد، مقایسه نتایج خالی از فایده نخواهد بود. برای مثال ممکن است پژوهشگری گروهبندی واحدهای جغرافیایی را بر اساس مجاورت انجام دهد و ببیند که چه اتفاقی برای ضرایب byxو bxy می افتد.
  7. به مساله همخطی متغیرهای مستقل توجه خاصی باید داشت. در صورت وجود هم خطی خطاهای فاحش در نمونه گیری می توانند مانعی برای ارزیابی تاثیر نسبی هر یکی از متغیرها محسوب شود
  8. انتشار نتایج پژوهش. این عمل باعث می شود تلاش برای تراکمی کردن دانش صورت محتمل تری به خود بگیرد و نیز داده هایی برای تحقیقات بیشتر در زمنیه ی روش شناسی فراهم آورد.