چندی پیش مطلبی در ارتباط با زبان برنامه نویسی R براتون نوشتم. امروز میخواهم بیشتر به زبان برنامه نویسی R بپردازم.


بیشتر این مطالب از مقاله Ashlee Vance به آدرس: http://www.nytimes.com/2009/01/07/technology/business-computing/07program.html


گرفته شده است.


برای بعضی ها R فقط 18همین حرف الفبای انگلیسی است. برای برخی دیگر R یک رتبه (درجه دسته بندی) در فیلم­های مهیج است. برای برخی ها نیز یک درجه عایق استفاده شده برای اتاق زیر شیروانی و یا حرفی هست که دزدان دریایی در فیلم ها می­گویند.


R همچنین نام یک زبان برنامه نویسی و نرم­افزار مهم و کاربرپسند است که برای آنالیز داده­ها استفاده می­شود. این برنامه در حال تبدیل شدن به یک زبان برنامه نویسی بین المللی است. چرا که امروز داده کاوی یکی از کارهای اجتناب ناپذیر هر علمی شده است. امروزه شرکت های مختلف از جمله Google, Pfizer, Merck, Bank of America, the InterContinental Hotels Group و  Shell از آن به صورت روزمره استفاده می­کنند.


اما شاید این سوال برای شما پیش بیاید چرا این برنامه را R نامیده اند؟ این سوالی است که برای خودم هم پیش آمده اما فقط همین را میتوانم بگویم که R اولین بار در سال 1996 ظهور یافت که دو پروفسور آمار نیوزلندی به نام های Robert Gentleman و Ross Ihaka یک کد برنامه نویسی را به همراه  نرم افزار به صورت رایگان منتشر کردند. شاید دلیل نامگذاری R به خاطر حرف اول اسم کوچک این دو پرفسور آمار باشد.


یک محقق در شرکت Google که از نرم افزار R استفاده می کند گفته نرم­افزار R آنقدر مهم است که ارزش آن قابل شمردن نیست. این نرم افزار به محققان و دانشجویان این اجازه را می دهد که آنالیزهای پیچیده و برهمکنشی را بدون اینکه از پس زمینه نرم افزار و روش های آماری اطلاعی داشته باشد را انجام دهند.


جالب اینکه این نرم افزار مجانی است. این قابلیت را دارد که کدهای خود را که در زبان برنامه نویسی مانند C++ نوشته ای را در اینجا برای محققان دیگر به اشتراک بگذاری، کدهای نوشته شده را اصلاح کنید و از بسته های نرم افزاری دیگران استفاده کنی. پس هم یک زبان برنامه نویسی است و هم یک بسته نرم­افزاری برای کاربران می باشد. خیلی اوقات محققان آماری در زمینه برنامه نویسی به توابع و الگوریتم های نیاز دارند که نوشتن آنها به زمان بسیار زیادی نیاز دارد. اما با استفاده از R کاربر میتواند به راحتی از متدها و توابعی که دیگران نوشته اند استفاده کند. برخی از کاربران R آن را به عنوان یک نسخه پیشرفته excel می داند زیرا به راحتی میتواند ویرایش و آنالیزهای دادها را با آن انجام داد.


در حال حاضر بیش از 3117  بسته نرم افزاری  برای R نوشته شده است. واقعیتش من فکر نمی کنم تا حالا هیچ نرم­ افزاری به این گستردگی نوشته شده باشد. برخی از دانشجویان به من گفته اند که این نرم افزار به زودی جایگزین SAS می شود. اما  باید بگم SAS که چه عرض کنم، دیگر نرم افزارهای برآورد پارامتر هم دارند کنار میروند. فقط بگم این نرم افزار واقعاً محشر است، هر چه دلت بخواد توی آن پیدا میکنی.  بعضی ها میگن شبیه نرم­افزار Matlab است. از این جنبه که قابلیت نوشتن برنامه در ان هست بله. مثل Matlab است. اما شما برید ببینید آیا میتوانید به نرم افزار Matlab فایل شجره و داده را بدی برایتون BV یا پارامتر ژنتیکی محاسبه کنه. برای اینکار در نرم افزار Matlab مجبور بودید صدها خط برنامه مینوشتید اما با R همین کار را با 10 خط میتونید انجام بدید.


اینکه تعداد کاربران نرم افزار R چقدر است را نمی توان دقیق گفت اما در سال 2009 حدود 250000 نفر تخمین زده شد. که من شک ندارم تا امروز این تعداد از 500000 نفر هم گذشته است. همچنین در این مقاله نوشته شده کاربرپسندی و قابلیت های دیگر R میتواند تجارت موسسئسه هایی که SAS را سازماندهی می کننند تهدید کند که قطعاً همینطور هست. مثل خود من، از زمانی که با R آشنا شده ام خیلی کمتر از SAS استفاده میکنم. البته شرکتی که SAS را نوشته و پخش می کند هم بیکار ننشسته و  امروز SAS نسخه 9.2 با قابلیت بالاتر و با کتابهای راهنمای بسیار باکیفیتی را وارد بازار کرده است.  


بااین وجود R  یکسری نقایصی هم دارد که قطعاً به زودی حل خواهند شد. یکی از آنها این است که برای برخی packageها و متدها به حافظه کامپیوتری بالایی نیاز دارد. برخی از packageهای آن روی برخی سیستم عامل ها جواب نمی دهند مثلاً package MCMCGlmm  گاهی اوقات روی ویندوز 7 کار نمی کند باید حتماً از XP یا لینوکس استفاده شود. از نظر حافظه محدودیت دارد. سرعت ان نسبتاً کند است. اما همچنان تهیه کنندگان این نرم افزار در تلاشند تا کاستی های آن را جبران کنند. که قطعاً به زودی این کاستی ها را نیز برطرف خواهند کرد.