چکیده:رشد فزاینده پایگاه داده ها در تقریبا هر ناحیه از فعالیت انسان باعث شده است که نیاز برای ابزارهای قدرتمند جدید برای تغییر دادن داده به دانش مفید افزایش یابد. برای برآوردن این نیاز محققان در ناحیه های مختلف مانند یادگیری ماشین، شناسایی الگو، آنالیز داده آماری، بصری سازی داده ، شبکه های عصبی، اقتصاد سنجی، بازیابی اطلاعات، استخراج اطلاعات و..... روش ها و ایده هایی را کاوش کرده اند. ذات غیرساخت یافته ی این متون، اعمال همان روشهایی را که ما در مورد پایگاه داده های غیرمتنی بکار می بریم، غیر ممکن می سازد. بنابراین روش ها و الگوریتم های پردازش (پیش پردازش)خاصی برای استخراج الگوهای مفید موردنیاز است. متن کاوی اطلاعات متنی غیرساختیافته را استفاده می کند و آنرا برای کشف ساختار و معناهای ضمنی پنهان در متن بررسی می کند. در این مقاله ما به بررسی یکی از جدیدترین زمینه های مورد تحقیق در داده کاوی، متن کاوی می پردازیم. در این مقاله روش های موجود برای پیش پردازش کردن، رده بندی، استخراج اطلاعات ، روش های یافتن روابط شرح داده می شوند در پایان هر بخش ارزیابی و مقایسه ای روی روش های بیان شده در آن بخش صورات می گیرد و در پایان تعدادی از کاربردهای متن کاوی بیان می گردند.
کلید واژه: کاوش، یادگیری ماشین، بصری سازی، آنالیز داده، متن کاوی، الگوریتم های پردازش، شبکه های عصبی، استخراج اطلاعات، متن کاوی، رده بندی
فهرست مطالب:چکیده
1 مقدمه
1.1 کشف دانش و ارتباط آن متن کاوی
2.1 تعاریف متن کاوی
3.1 ناحیه های سرچ مرتبط
2 روش ها پیش پردازش کردن متون
1.2 مدل فضای برداری
2.2 پیش پردازش زبان شناختی
3 روش های متن کاوی
1.3 فازهای اصلی فرآیند کتن کاوی
2.3 رده بندی
1.2.3 انتخاب ترم ایندکس
2.2.3 رده کننده Naïve Bayes
3.2.3 رده بندی کننده نزدیکترین همسایه
4.2.3 درخت تصمیم گیری
5.2.3 متدهای هسته و SVM
6.2.3 ارزیابی رده بندی کننده ها
3.3 استخراج اطلاعات
1.3.3 رده بندی برای استخراج اطلاعات
2.3.3 مدل مارکوف پنهان
3.3.3 فیلدهای رندم شرطی
4.3.3 مقایسه روش های استخراج اطلاعات
2.2 پیش پردازش زبان شناختی
4.3 روش ها ترکیبی
1.4.3 روش های dicsotex
1.1.4.3 مقدمه
2.1.4.3 یکپارچه کردن داده کاوی و استخراج اطلاعات
3.1.4.3 سیستم dicsotex
2.4.3روش textminer
1.2.4.3 مقدمه
2.2.4.3 استخراج اطلاعات
3.2.4.3 الگوریتم خوشه بندی
3.4.3 یافتن روابط
4.4.3 مقایسه روش های ترکیبی
4 کاربردهای متن کاوی
5 نتیجه گیری و کارهای آینده
6 مراجع
-
راهنمای استفاده:
مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات
-
محتوای فایل دانلودی:
در قالب فایل word و قابل ویرایش
همراه با شکل، نمودار و منابع
سجاد
جمعه 22 مرداد 1395 ساعت 12:13