خوشه بندي اسناد وب با استفاده از روابط هم ارزي
خوشه بندي اسناد وب با استفاده از روابط هم ارزي
مقدمه: در دهه ي اخير اطلاعات موجود در اينترنت رشد زيادي داشته است تا جايي كه امروزه مهمترين منبع اطلاعات محسوب مي شود. بازيابي اطلاعات از اينترنت با توجه به رشد ساعت به ساعت آن و كاربراني كه از آن استفاده مي كنند، حائز اهميت است. به طور عملي غير ممكن است كه اين پايگاه داده توسط كاربر جستجو شود. از اين رو نياز به موتورهاي جستجو افزايش مي يابد. موتورهاي جستجو از يابنده هايي (crawler) استفاده مي كنند تا اطلاعات را جمع آوري كرده و اين داده ها را در پايگاه دادهاي متصل به موتور جستجو ذخيره مي كنند. براي يك جستجو و پرسش مشخص فرد از موتور جستجو در پايگاه داده ي محلي استفاده مي كند و به سرعت نتايج را مي بيند.
توانايي تشكيل گروههاي معنادار از موضوعات يكي از مهمترين حالات هوشمندي محسوب مي شود. انسان ها اين عمل را به آساني انجام مي دهند. تحليل خوشه اي ابزاري است كه براي كشف ساختار داده ها استفاده مي شود. هسته ي اصلي مربوط به تحليل خوشه اي خوشه بندي است. فرآيند گروهبندي موضوعات در خوشه ها به طوري كه موضوعات در يك خوشه بيشترين شباهت را به يكديگر داشته باشند و از خوشه هاي ديگر بيشترين تفاوت را داشته باشند. نياز به ساختاربندي و آموختن مقدار بسيار زياد و گوناگون داده ها باعث تشكيل يك حوزه ي پژوهشي فعال در مورد خوشه بندي شده است.
وب كاوي استفاده از تكنيك هاي داده كاوي براي كشف خودكار و استخراج داده ها از وب است. خوشه بندي يكي از تكنيك هاي محتمل براي اصلاح كارايي فرايند جستجوي اطلاعات مي باشد. اين تكنيك يكي از ابزار داده كاوي براي گروهبندي موضوعات در خوشه ها مي باشد.
وب كاوي ماهيت فازي دارد، بنابراين خوشه بندي فازي در بعضي مواقع براي وب كاوي مناسب تر از خوشه بندي سنتي است. خوشه بندي فازي يك تكنيك مرتبط با بازيابي اطلاعات است. زماني كه يك سند به چندين نوع مخصوص جستجو مربوط است، اين سند بايد منطبق بر مجموعه اي از پاسخ ها باشد در غير اين صورت كاربران از آن اطلاعي پيدا نمي كنند. خوشه بندي فازي به نظر مي رسد تكنيكي طبيعي براي طبقه بندي اسناد وبي باشد. دو روش پايه اي عبارتند از: خوشه بندي فازي كه مبتني بر بخش هاي C است و به روش خوشه بندي ميانگين هاي C مشهور است و ديگري روش رابطه هاي هم ارزي فازي است و به روش خوشه بندي هم ارز فازي شهرت دارد. هدف اين مطالعه اين است كه روش شناسي را ارائه دهد و چگونگي پيدا كردن اطلاعات مربوط به شبكه ي جهاني وب را بيابد. روشي كه در اينجا بحث مي شود خوشه بندي اسناد است كه بر مبناي رابطه ي هم ارزي فازي است و به بازيابي اطلاعات كمك مي كند.
مقدمه: در دهه ي اخير اطلاعات موجود در اينترنت رشد زيادي داشته است تا جايي كه امروزه مهمترين منبع اطلاعات محسوب مي شود. بازيابي اطلاعات از اينترنت با توجه به رشد ساعت به ساعت آن و كاربراني كه از آن استفاده مي كنند، حائز اهميت است. به طور عملي غير ممكن است كه اين پايگاه داده توسط كاربر جستجو شود. از اين رو نياز به موتورهاي جستجو افزايش مي يابد. موتورهاي جستجو از يابنده هايي (crawler) استفاده مي كنند تا اطلاعات را جمع آوري كرده و اين داده ها را در پايگاه دادهاي متصل به موتور جستجو ذخيره مي كنند. براي يك جستجو و پرسش مشخص فرد از موتور جستجو در پايگاه داده ي محلي استفاده مي كند و به سرعت نتايج را مي بيند.
توانايي تشكيل گروههاي معنادار از موضوعات يكي از مهمترين حالات هوشمندي محسوب مي شود. انسان ها اين عمل را به آساني انجام مي دهند. تحليل خوشه اي ابزاري است كه براي كشف ساختار داده ها استفاده مي شود. هسته ي اصلي مربوط به تحليل خوشه اي خوشه بندي است. فرآيند گروهبندي موضوعات در خوشه ها به طوري كه موضوعات در يك خوشه بيشترين شباهت را به يكديگر داشته باشند و از خوشه هاي ديگر بيشترين تفاوت را داشته باشند. نياز به ساختاربندي و آموختن مقدار بسيار زياد و گوناگون داده ها باعث تشكيل يك حوزه ي پژوهشي فعال در مورد خوشه بندي شده است.
وب كاوي استفاده از تكنيك هاي داده كاوي براي كشف خودكار و استخراج داده ها از وب است. خوشه بندي يكي از تكنيك هاي محتمل براي اصلاح كارايي فرايند جستجوي اطلاعات مي باشد. اين تكنيك يكي از ابزار داده كاوي براي گروهبندي موضوعات در خوشه ها مي باشد.
وب كاوي ماهيت فازي دارد، بنابراين خوشه بندي فازي در بعضي مواقع براي وب كاوي مناسب تر از خوشه بندي سنتي است. خوشه بندي فازي يك تكنيك مرتبط با بازيابي اطلاعات است. زماني كه يك سند به چندين نوع مخصوص جستجو مربوط است، اين سند بايد منطبق بر مجموعه اي از پاسخ ها باشد در غير اين صورت كاربران از آن اطلاعي پيدا نمي كنند. خوشه بندي فازي به نظر مي رسد تكنيكي طبيعي براي طبقه بندي اسناد وبي باشد. دو روش پايه اي عبارتند از: خوشه بندي فازي كه مبتني بر بخش هاي C است و به روش خوشه بندي ميانگين هاي C مشهور است و ديگري روش رابطه هاي هم ارزي فازي است و به روش خوشه بندي هم ارز فازي شهرت دارد. هدف اين مطالعه اين است كه روش شناسي را ارائه دهد و چگونگي پيدا كردن اطلاعات مربوط به شبكه ي جهاني وب را بيابد. روشي كه در اينجا بحث مي شود خوشه بندي اسناد است كه بر مبناي رابطه ي هم ارزي فازي است و به بازيابي اطلاعات كمك مي كند.
+ نوشته شده در دوشنبه ۳ مرداد ۱۳۹۰ ساعت توسط
|