دانش داده کاوی(data mining)
داده کاوی(data minnig) پل ارتباطی میان علم آمار ، علم کامپیوتر ، هوش
مصنوعی ، الگوشناسی ، فراگیری ماشین و بازنمایی بصری داده میباشد. داده
کاوی فرآیندی پیچیده جهت شناسایی الــگوها و مـدل های صحیح، جدید و به
صورت بالقوه مفید، در حجم وسیعی از داده میباشد، به طریقی که این الگو ها
و مدلها برای انسانها قابل درک باشند. داده کاوی به صورت یک محصول قابل
خریداری نمیباشد، بلکه یک رشته علمی و فرآیندی است که بایستی به صورت یک
پروژه پیاده سازی شود. دادهها اغلب حجیم میباشند و به تنهایی قابل
استفاده نیستند، بلکه دانش نهفته در دادهها قابل استفاده میباشد.
بنابراین بهره گیری از قدرت فرآیند داده کاوی جهت شناسایی الگوها و مدلها
و نیز ارتباط عناصر مختلف در پایگاه داده جهت کشف دانش نهفته در دادهها و
نهایتا تبدیل داده به اطلاعات، روز به روز ضروری تر میشود. کاربرد: یکی
از نمونههای بارز داده کاوی را میتوان در فروشگاههای زنجیرهای مشاهده
نمود، که در آن سعی میشود ارتباط محصولات مختلف هنگام خرید مشتریان مشخص
گردد. فروشگاههای زنجیرهای مشتاق هستند بدانند که چه محصولاتی با یکدیگر
به فروش میروند . برای مثال طی یک عملـیات داده کاوی گستـرده در یـک
فروشـگاه زنجیرهای در آمریکای شمالی که بر روی حجـم عظیمـی از دادههای
فروش صورت گرفت، مشخص گردید که مردانی که برای خرید قنداق بچه به فروشگاه
میروند معمولا آب جو نیز خریداری میکنند. همچنین مشخص گردید مشتریانی که
تلویزیون خریداری میکنند، غالبا گلدان کریستالی نیز می خرند. نمونه مشابه
عملیات داده کاوی را میتوان در یک شرکت بزرگ تولید و عرضه پوشاک در اروپا
مشاهده نمود، به شکلی که نتایج داده کاوی مشخص میکرد که افرادی که کراوات
های ابریشمی خریداری میکنند، در همان روز یا روزهای آینده گیره کراوات
مشکی رنگ نیز خریداری میکنند. به روشنی این مطلب قابل درک است که این نوع
استفاده از داده کاوی میتواند فروشگاهها را در برگزاری هوشمندانه
فستیوال های فروش و نحوه ارائه اجناس به مشتریان یاری رساند. نمونه دیگر
استفاده از داده کاوی در زمینه فروش را میتوان در یک شرکت بزرگ دوبلاژ و
تکثیر و عرضه فیلم های سینمایی در آمریکای شمالی مشاهده نمود که در آن
عملیات داده کاوی، روابط مشتریان و هنرپیشههای سینمایی و نیز گروههای
مختلف مشتریان بر اساس سبک فیلم ها ( ترسناک، رمانتیک، حادثهای و ...)
مشخص گردید. بنابراین آن شرکت به صورت کاملا هوشمندانه میتوانست مشتریان
بالقوه فیلم های سینمایی را بر اساس علاقه مشتریان به هنرپیشههای مختلف و
سبک های سینمایی شناسایی کند. از دیگر زمینههای به کارگیری داده کاوی،
استفاده بیمارستانها و کارخانههای داروسازی جهت کشف الگوها و مدلهای
ناشناخته تاثیر دارو ها بر بیماری های مختلف و نیز بیماران گروههای سنی
مختلف را میتوان نام برد. رابطه داد کاوی با آنالیز آماری: داده کاوی
معمولا با نوشتن مقدار زیادی گزارش و تحقیق و استعلام در آنها اشتباه
گرفته میشود. اما در واقع داده کاوی هیچ کدام از اینها را شامل نمیشود
بلکه داده کاوی توسط تجهیزات خاصی صورت می پذیرد، که عملیات کاوش را بر
اساس تجزیه و تحلیل مکرر دادهها انجام میدهد. داده کاوي با آنالیز های
متداول آماری نیز متفاوت است؛در زیرمی توان برخی از اصلی ترین تفاوت های
داده کاوي و آنالیز آماری را مشاهده نمود: آنالیز آماری: • آمار شناسان
همیشه با یک فرضیه شروع به کار میکنند. • آنها از دادههای عددی استفاده
میکنند. • آمارشناسان باید رابطههایی را ایجاد کنند که به فرضیه آنها
مربوط است. • آنها میتوانند دادههای نابجا و نادرست را در طول آنالیز
مشخص کنند. • آنها میتوانند نتایج کار خود را تفسیر و برای مدیران بیان
کنند. داده کاوی: • به فرضیه احتیاجی ندارد. • ابزارهای داده کاوی از
انواع مختلف داده ، نه تنها عددی میتوانند استفاده کنند. • الگوریتمهای
داده کاوی به طور اتوماتیک روابط را ایجاد میکنند. • داده کاوی به
دادههای صحیح و درست نیاز دارد. • نتایج داده کاوی نسبتا پیچیده میباشد
و نیاز به متخصصانی جهت بیان آنها به مدیران دارد. جهت درک بهتر تفاوت
داده کاوی و آنالیزهای آماری به مثال زیر که در مورد شناخت کلاهبرداری های
شرکت بیمه میباشد، توجه کنید. نمونهای از روش آنالیز آماری: یک مفسر
ممکن است متوجه الگوی رفتاری شود که سبب کلاهبرداری بیمه گردد. بر اساس
این فرضیه، مفسر به طرح یک سری سوال میپردازد تا این موضوع را بررسی کند.
اگر نتایج حاصله مناسب نبود، مفسر فرضیه را اصلاح میکند و یا با انتخاب
فرضیه دیگری مجددا شروع میکند. این روش نه تنها وقت گیر است بلکه به قدرت
تجزیه و تحلیل مفسر نیز بستگی دارد. مهمتر از همه اینکه این روش هیچ وقت
الگوهای کلاهبرداری دیگری را که مفسر به آنها مظنون نشده و در فرضیه جا
نداده ، پیدا نمیکند. نمونهای از روش داده کاوی: یک مفسر سیستم های داده
کاوی را ساخته و پس از طی مراحلی از جمله جمع آوری داده ها، یکپارچه سازی
و اخلاص دادهها به انجام عملیات داده کاوی میپردازد. داده کاوی تمام
الگوهای غیرعادی را که از حالت عادی و نرمال انحراف دارند و ممکن است منجر
به کلاهبرداری شوند را پیدا میکند. نتایج داده کاوی حالت های مختلفی را
که مفسر باید در مراحل بعدی تحقیق کند، نشان میدهند. در نهایت مدل های به
دست آمده میتوانند مشتریانی را که امکان کلاهبرداری دارند، پیش بینی
نمایند. فواید و نقش داده کاوی در فعالیت شرکتها:امروزه عملیات داده کاوی
به صورت گسترده توسط تمامی شرکت هایی که مشتریان در کانون توجه آنها قرار
دارند، استفاده میشود، از جمله فروشگاه ها، شرکت های مالی، ارتباطاتی،
بازاریابی و غیره. استفاده از داده کاوی به این شرکتها کمک میکند تا
ارتباط عوامل داخلی از جمله قیمت، محل قرارگیری محصولات، مهارت کارمندان
را با عوامل خارجی از جمله وضعیت اقتصادی، رقابت در بازار و محل جغرافیایی
مشتریان کشف نمایند.از آنجـائیـکه هـوش مصنوعی یکی از اصلی ترین عنــاصـر
داده کـــاویمی باشد و با توجه به اینکه به کمک سیستم های کامپیوتری و
پایگاههای داده، روزانه به میزان دادهها افزوده میشود، بنابراین
استفاده هوشمندانه از دانش بالقوهای که در این داده نهفته است در دنیای
رقابتی امروز برای شرکت ها حیاتی میباشد.داده کاوی پیش بینی وضع آینده
بازار، گرایش مشتریان و شناخت سلیقههای عمومی آنها را برای شرکت ها ممکن
می سازد.
مراحل اصلی داده کاوی : داده کاوی را " کشف دانش در دادهها " نیز می نامند. کشف دانش دادهها دارای مراحل مختلفی میباشد که در اینجا به صورت خلاصه آنها را بیان می کنیم : • استخراج اطلاعات از چندین منبع داده ( پایگاه داده). • یکپارچه سازی اطلاعات و حذف دادههای زاید. • قرار دادن اطلاعات اصلاح شده در انبار داده ها. • انجام عملیات داده کاوی توسط نرم افزار های مخصوص. • نمایش نتایج به صورت قابل فهم مانند گزارش و گراف
+ نوشته شده در شنبه ۲۱ آذر ۱۳۸۸ ساعت توسط
|