تحلیل رگرسیون از ویکیپدیا، دانشنامهٔ آزاد
در متن این مقاله از هیچ منبع و مأخذی نام برده نشدهاست.
شما میتوانید با افزودن منابع برطبق اصول اثباتپذیری و شیوهنامهٔ ارجاع به منابع، به ویکیپدیا کمک کنید.
مطالب بیمنبع احتمالاً در آینده حذف خواهند شد.
تحلیل رگرسیونی یا تحلیل وایازش (به انگلیسی: Regression analysis) فن و تکنیکی آماری برای بررسی و مدلسازی ارتباط بین متغیرها است. رگرسیون تقریباً در هر زمینهای از جمله مهندسی، فیزیک، اقتصاد، مدیریت، علوم زیستی، بیولوژی و علوم اجتماعی برای برآورد و پیش بینی مورد نیاز است.
تحلیل رگرسیونی، یکی از پرکاربردترین روش در بین تکنیکهای آماری است.
محتویات [نهفتن]
۱ تعریف لغوی
۲ تاریخچه
۳ رگرسیون کاذب
۴ شیوهها
۵ محاسبه
۵.۱ نرم افزارها
۶ جستارهای وابسته
۷ منابع
تعریف لغوی [ویرایش]
واژه رگرسیون(Regression) را از لحاظ لغوی در فرهنگ لغت به معنی پسروی، برگشت و بازگشت است. اما از دید آمار و ریاضیات به مفهوم بازگشت به یک مقدار متوسط یا میانگین به کار میرود. بدین معنی که برخی پدیدهها به مرور زمان از نظر کمی به طرف یک مقدار متوسط میل میکنند.
تاریخچه [ویرایش]
در سال ۱۸۷۷ فرانسیس گالتون (به انگلیسی: Francis Galton) در مقالهای که درباره بازگشت به میانگین منتشر کرده بود. اظهار داشت که متوسط قد پسران دارای پدران قد بلند، کمتر از قد پدرانشان میباشد. به نحو مشابه متوسط قد پسران دارای پدران کوتاه قد نیز بیشتر از قد پدرانشان گزارش شدهاست. به این ترتیب گالتون پدیده بازگشت به طرف میانگین را در دادههایش مورد تأکید قرار داد. برای گالتون رگرسیون مفهومی زیستشناختی داشت اما کارهای او توسط کارل پیرسون (به انگلیسی: Karl Pearson) برای مفاهیم آماری توسعه داده شده. گرچه گالتون برای تأکید بر پدیده «بازگشت به سمت مقدار متوسط» از تحلیل رگرسیون استفاده کرد، اما به هر حال امروزه واژه تحلیل رگرسیون جهت اشاره به مطالعات مربوط به روابط بین متغیرها به کار برده میشود.
رگرسیون کاذب [ویرایش]
رگرسیون کاذب (به انگلیسی: regression ) با فرض اینکه متغیرهای و مانا میباشد تخمینهای ما از پارامترها و تستهای و درست میباشد. برای نشان دادن سازگاری تخمینهای حداقل مربعات معمولی؛ ما از این نتایج زمانیکه اندازه نمونه افزایش مییابد و واریانس نمونه به واریانس جامعه همگرا میشود، استفاده میکنیم. متاسفانه وقتی سری نامانا باشد واریانس خوش تعریف نیست زیرا حول یک میانگین ثابت نوسان نمیکند. برای توضیح بیشتر دو متغیر و را در نظر بگیرید که بوسیله یک فرآیند گام تصادفی تعریف میشود.
که و دارای توزیع مستقل میباشد.هیچ دلیلی برای ارتباط بین و وجود ندارد یک محقق اگراثر راروی و یک جز ثابت رگرس کندو رگرسیون زیر را انجام دهد :
خط راست:
نتایج این رگرسیون ممکن است بوسیله r^۲ بالاوخود همبستگی بالا بین باقیمانده هاو همجنین دارای ارزش معنی داری برای پارامتر باشد. این پدیده به رگرسیون کاذب معروف است. در این گونه از موارد دو سری نامانا ارتباط کاذبی دارند به این علت که که هر دوی آنها در طول زمان تغییر میکنند و تابعی از زمانند. هماطور که گراجر و نی یو بلد بیان کردند در این حالت رگرسیون دارای r^۲ بالا؛ و آماره دوربین واتسون پایین خواهد بود و تستهای و ممکن است خیلی گمراه کننده باشند. دلیل آن نیز این است که توزیعهای آمارههای تستهای سنتی خیلی متفاوت از نتایجی که تحت فرض مانایی گرفته میشود، میباشد. بخصوص همانطور که فلیپس (۱۹۸۷)نشان داد؛ همانطور که اندازه نمونه افزایش مییابد نمیتوان به معنی داری تخمین زن حداقل مربعات معمولی وآمارههای تستهای و و آماره دوربین واتسون اعتماد کرد. دلیل آن این است که و متغیرهای میباشد و جر خطا نیزیک متغیرنامانامیباشد.
اگر ارزشهای گذشته هر دو متغیر وابسته و مستقل را در رگرسیون وارد کنیم مشکل رگرسیون کاذب حل میشود. در این حالت تخمینهای حداقل مربعات معمولی برای همه پارامترها سازگار میباشد.
شیوهها [ویرایش]
شیوههای مهم تحلیلهای رگرسیونی به شرج زیر هستند.
رگرسیون خطی ساده
رگرسیون خطی چندگانه
رگرسیون فازی
رگرسیون لجستیک
این تنوع باعث شده که بتوان به راحتی هر نوع دادهای (اغلب از نوع دادههای پیوسته) را تحلیل کرد و به راحتی نتیجه گیری نمود.
محاسبه [ویرایش]
برای انجام یک تحلیل رگرسیونی ابتدا تحلیلگر حدس میزند که بین دو متغیر، نوعی ارتباط وجود دارد، در حقیقت حدس میزند که یک رابطه به شکل یک خط بین دو متغیر وجود دارد و سپس به جمعآوری اطلاعات کمی از دو متغیر میپردازد و این دادهها را به صورت نقاطی در یک نمودار دو بعدی رسم میکند.
نرم افزارها [ویرایش]
نرم افزارهای بسیاری هستند که قابلیت محاسبه رگرسیون را دارند و مشهورترین آنها عبارتند از
نرم افزار اکسل (که ساده ترین نرم افزار است)
اسپیاساس SPSS
اسپلاس +S یا Plus-S
ساس (نرمافزار) SAS
جستارهای وابسته [ویرایش]
رگرسیون
منابع [ویرایش]
ردهها: آمار ریاضیاقتصادسنجیتحلیل رگرسیونروشهای آماری