فایلود نیو

دانلود جزوه و تحقیقات آموزشی دانشجویی

فایلود نیو

دانلود جزوه و تحقیقات آموزشی دانشجویی

کاوش در شبکه گسترده جهانی


	کاوش در شبکه گسترده جهانی


مقدمه:
حوزه های تحقیقاتی وب معنایی و وب کاوی به سرعت در حال پیشرفت است. هر کدام از این حوزه ها مکمل یکدیگر هستند زیرا هر یک قسمتی از چالش های جدیدی که در وب کنونی وجود دارد را مورد بررسی قرار می دهند. همچنین تحقق کامل حوزه ی جدید وب معنایی مستلزم ارتقاء سطح داده های موجود بر روی وب کنونی به سمت دانش می باشد. برای این منظور روش های مختلف وب کاوی می توانند برای رسیدن به دانش نهفته در داده های موجود و همچنین پیدا کردن کاندیداهای مناسب برای شرکت در فرایند ایجاد آنتولوژی های مربوطه، مورد استفاده قرار گیرند. فقدان یک چارچوب مشخص جهت استفاده از روش های وب کاوی در حوزه ی وب معنایی ، بهره گیری مناسب از روش های مذکور را از محققین حوزه ی وب معنایی سلب نموده است.
توسط اطلاعات روی وب، امکان استخراج داده و دستیابی به اطلاعات برای کاربران بسیار آسان و مطلوب شده است وعمل جستجو روی اینترنت را برای کاربران خیلی آسانتر خواهد ساخت. بنابراین بهره­های زیادی در Webminnig  وجود دارد، از جمله کاوش پایگاه داده­ها روی وب یا کاوش الگوهای مورد استفاده را می­توان نام برد تا اطلاعات مفید برای کاربران تامین شوند.

فهرست مطالب:
۱- مقدمه
۲- تاریخچه وب    
۳- اینترنت و وب    
۳-۱  وب 1    
۳-۱-۱  چهره های گوناگون وب:    
۳- ۲ وب 2    
۳-3 وب 3    
۳-۵ مقایسه وب 1 , وب2 ,  وب3    
۳-۵-۱  دیدگاه اول: تولید محتوا    
۳-۵-۲ دیدگاه دوم: ماهیت محتوا    
۳-۵-۳ دیدگاه سوم: از لحاظ ارتباطی    
۳-۵-۴ دیدگاه چهارم: رابط کاربری    
۳-۵-۵ دیدگاه پنجم: تکنولوژیهای غالب    
۴- مشکلات وب
۵-داده کاوی چگونه تعریف می شود؟    
۶- تعریف وب کاوی    
۷- مراحل وب کاوی
۷-۱. پیدا کردن منبع
۷-۲. انتخاب اطلاعات و پیش پردازش
۷-۳. تعمیم
۷-۴. تحلیل
۸- تفاوت داده کاوی و وب کاوی    
۹- رابطه وب کاوی و داده کاوی    
۱۰- انواع موتورهای جستجو
۱۰-۱ مشکلات موتورهای جستجو
موتورهای جستجو دارای دو مشکل اصلی هستند
۱۱- وب کاوی و موتورهای جستجو
۱۲- بازیابی اطلاعات    
۱۳- طبقه بندی وب کاوی:    
۱۳-۱ کاوش محتوای وب    
۱۳-۱-۱  انواع کاوش محتوا در وب    
۱۳-۱-۲ طبقه بندی    
۱۳-۱-۳ خوشه بندی    
۱۳-۱-۴ سایر انواع کاوش محتوا در وب    
۱۳-۲ کاوش ساختار وب ( WEB STRUCTURE MINING )    
۱۳-۳  کاوش کاربردی وب ( WEB USAGE MINING)
۱۳-۳-۱ نمونه هایی از کاربردهای کاوش کاربری وب
۱۳-۳-۲ فرآیند کاوش کاربردی وب دو نگرش کلی دارد 
روش تشخیص هویت کاربر برای مدل کردن رفتار کاربر
۱۴- مقایسه انواع عملیاتی که در وبکاوی انجام میشوند    
۱۴- مقیاسهای اصلی برای مقایسه روشهای وب کاوی    
۱۴-۱ کاوشگر وب    
۱۴-2- دروازة وب    
14-3- مقایسة موتور جستجوهای دروازة وب و کاوشگر وب    
۱۵- انواع الگوریتم های وب کاوی    
۱۵-۱. درخت تصمیم
۱۵-۲. شبکه عصبی
۱۵-۳. PAGE RANK 
۱۶-عمده ترین کاربردهای وب کاوی عبارتند از
۱۷- تجارت الکترونیکی    
۱۸- گوگل و وب کاوی
۱۹-  چالش های وب کاوی
۱۹-۱. داده های ناصحیح و نادقیق 
۱۹-۲. عدم وجود ابزارها 
۱۹-۳ . ابزارهای سفارشی
20- داده کاوی در وب روی پایگاه داده ها وانبار داده:    
۲۰-۱ داده کاوی در وب روی پایگاه داده ی رابطه ایWEB
20-۲ داده کاوی  چند رسانه ای
20-۳ انبار داده و کاوش در اینترنت
21- کاربردهای کاوش استفاده از وب    
21-۱خصوصی سازی محتوای وب    
21-۲ پیش بازیابی    
21-۳  بهبود طراحی سایت های وب    
22- کاربردهای وب کاوی    
22-۱ تجارت الکترونیکی    
22-2- موتورهای جستجو    
23-3- حراجی در وب    
۲۴- وب کاوی در ایران
۲۰-۱ مشکلات ومحدودیت های وب کاوی در سایت های فارسی زبان    
25- مرور و نتیجه گیری    
۲۶- منابع    


تعداد مشاهده: 1348 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 47

حجم فایل:456 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش کامل
    به همراه شکل، جدول، نمودار و فهرست منابع


بررسی تکنیک های داده کاوی در سازمان ها


	بررسی تکنیک های داده کاوی در سازمان ها


چکیده:
داده کاوی، استخراج اطلاعات و دانش و کشف الگوهای پنهان از یک پایگاه داده های بسیار بزرگ، کاربردهای زیادی در کسب و کارهای امروزی پیدا کرده است. استفاده از تکنیک های داده کاوی در سازمان ها منتج به تعداد زیادی قانون و الگو می شود که با توجه به محدودیت در منابع و بودجه، پیاده سازی همه ی آنها امکان پذیر نمی باشد. می توان گفت که ارزیابی و رتبه بندی قوانین وابستگی کاری مهم و چالش برانگیز است. با استفاده از از تکنیک ناپارامتریک تحلیل پوششی داده ها به ارائه چارچوبی برای ارزیابی و اولویت بندی قوانین وابستگی می پردازیم. در این تحقیق ابتدا مدلی برای شناسایی کاراترین واحد تصمیم گیری در حالت بازده متغیر به مقیاس ارائه می شود. پس از آن، با استفاده این مدل، متدی نوین جهت رتبه بندی واحدهای تصمیم گیری ارائه می شود. سپس با استفاده از مدل و متد پیشنهادی، چارچوبی نوین جهت رتبه بندی قوانین وابستگی داده کاوی توسعه داده می شود. در انتها، با پیاده سازی چارچوب پیشنهادی برای اولویت بندی قوانین وابستگی داده کاوی در بانک کشاورزی کاربردپذیری چارچوب پیشنهادی نشان داده می شود.
کلمات کلیدی: فناوری اطلاعات (IT)، الگوهای پنهان، داده کاوی (Data Mining)، تکنیک های داده کاوی، قوانین داده کاوی

فهرست مطالب:
چکیده
مقدمه ای بر داده‌کاوی
فصل اول: داده کاوی
1-1 چه چیزی سبب پیدایش داده کاوی شده است؟
1-2 مراحل کشف دانش
1-3 جایگاه داده کاوی در میان علوم مختلف
1-4 داده کاوی چه کارهایی نمی تواند انجام دهد؟
1-5 داده کاوی و انبار داده ها
1-6 داده کاوی و OLAP
1-7 کاربرد یادگیری ماشین و آمار در داده کاوی
1-8 توصیف داده ها در داده کاوی
1-8-1 خلاصه سازی و به تصویر در آوردن داده ها
1-8-2 خوشه بندی
1-8-3 تحلیل لینک
فصل دوم: پیش بینی دادها
2-1 مدل های پیش بینی داده ها
2-1-1 Classification
2-1-2 Regression
2-1-3 Time Series
2-2 مدل ها و الگوریتم های داده کاوی
2-2-1 شبکه های عصبی
2-2-2 Decision Trees
2-2-3 Multivariate Adaptive Regression Splines(MARS)
2-2-4 Induction Rule
2-2-5 (MBR) Earest Neibour and Memory-Based Reansoning -K
2-2-6 رگرسیون منطقی
2-2-7  تحلیل تفکیکی
2-2-8 مدل افزودنی کلی (GAM)
2-2-9 Boosting
فصل سوم انتخابها
3-1 سلسله مراتب انتخابها
3-2 کاربرد  علم آمار در داده کاوی
3-2-1 مقدمه و مقایسه
3-2-2 کاربردهای روشهای آماری 
3-3 پیش بینی (Prediction)
3-4 نگاه عمیق تر به شبکه عصبی
3-4-1 سابقه تاریخی
3-4-2 شبکه های عصبی در مقابل کامپیوتر های معمولی
3-4-3 چرا از شبکه های عصبی استفاده می کنیم؟
3-4-4 تفاوت‌های شبکه‌های عصبی با روش‌های محاسباتی متداول و سیستم‌های خبره
3-3-5 کاربردهای شبکه های عصبی
3-4  آشنایی با الگوریتم ژنتیک
3-5 الگوریتم مورچگان
3-5-1 کاربردهای الگوریتم مورچگان
فصل چهارم: داده کاوی در سازمانها
4-1 کاربردهای داده کاوی در کتابخانه ها و موسسات دانشگاهی
4-1-1 دیتامارت
4-2 عناصر داده کاوی
4-2-1 نرم افزار:
4-3 کاربردهای داده کاوی در کتابخانه ها و محیط های دانشگاهی
4-4 مدیریت موسسات دانشگاهی
فصل پنجم: نتیجه گیری و پیشنهادها
منابع و مراجع

تعداد مشاهده: 1464 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 90

حجم فایل:484 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش

کاوش قوانین وابستگی در جریانات سریع داده


	کاوش قوانین وابستگی در جریانات سریع داده


چکیده:
مسئله کاوش الگوهای تکراری در پایگاهای داده در سال 1993 توسط آگروال و دیگران ارائه شد[ 1]. این مسئله به علت کاربرد وسیع در تجارت، صنعت و علوم مختلف، موضوعی مهم و اساسی در زمینه کشف دانش و داده کاوی است. در سال های اخیر تحقیقات بسیار زیادی در مورد این مسئله انجام گرفته و پیشرفت های چشمگیری صورت گرفته است که حاصل آنها ارائه الگوریتم های کارا و مقیاس پذیر از یک طرف و مطرح شدن آن در کاربرد های مختلف بوده است. تحقیقات انجام شده عموماً در مورد کاوش الگوهای تکراری در پایگاه داده های ایستا بوده است به طوری که الگوریتم های مختلفی در این مورد ارائه شده اند.
کاوش الگوهای تکراری علاوه بر داده های ایستا، اخیراً در پایگاه داده های پویا و  جریان های داده 2 نیز مطرح شده است [8]. در داده های جریانی فرض بر این است که داده ها به صورت پشت سرهم و بی وقفه به سیستم می رسند. در یک جریان داده، داده ها با سرعت و به شکلی بی پایان دریافت می شوند.
انجام محاسبات مختلف آماری و داده کاوی، از جمله مسائل مطرح در مدل جریانی می باشند. در جریان های داده، در هرلحظه، حجم داده هایی که تاکنون رسیده و در آینده نیز خواهد رسید، بسیار زیاد است، بنابراین ذخیره آن امکانپذیر نیست.
در این تحقیق مدل های مختلف بررسی و شناسایی الگو در جریان داده ها مورد بررسی قرار گرفته و الگوریتم های ارائه شده قبلی در هر مدل مورد بررسی قرار می گیرد.
کلید واژه: کاوش الگوهای پرتکرار، داده کاوی، جریان سریع داده، الگوهای توالی

فهرست مطالب:
چکیده
فصل اول: معرفی مساله    
1-2- مقدمه    
1-3- کاوش قوانین وابستگی    
1-4- ضرورت انجام تحقیق    
1-5- سرفصل مطالب    
2- بیان مساله    
2-2- مقدمه    
2-3- مشکلات مساله یافتن الگوهای پرتکرار    
فصل سوم: ادبیات موضوع    
3-2- مقدمه    
3-3- مدل‌های پردازش و کاوش جریان‌های داده    
3-4- جریان کاوی مجموعه اقلام تکراری در مدل نشانه    
3-4-1- الگوریتم شمارش پر اتلاف    
3-4-2- الگوریتم جنگل مجموعه اقلام تکراری پسوندی    
3-5- کاوش مجموعه اقلام تکراری در مدل زوال    
3-5-1- محو زمانی به‌وسیله وزن دادن مستقیم    
3-5-2- الگوریتم استماکس    
3-6- کاوش مجموعه اقلام تکراری در مدل پنجره‌ای    
3-7- الگوریتم‌های بر اساس درخواست    
3-7-1- روش MFI-TRANSW    
3-7-2- الگوریتم استماکس+    
3-7-3- الگوریتم دی. اس. تری    
3-7-4- الگوریتم سی. پی. اس. تری    
3-8- سایر الگوریتم ها    
3-8-1- الگوریتم Moment    
فصل چهارم: جمع بندی    
فهرست منابع و مآخذ    
فهرست شکل ها

تعداد مشاهده: 1968 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 57

حجم فایل:10,782 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته کامپیوتر و فناوری اطلاعات

  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    همراه با شکل، نمودار، جدول، پاورقی، فهرست شکل ها، منابع

بررسی متدهای داده کاوی در محیط های توزیع شده، موازی و چند عامله


	بررسی متدهای داده کاوی در محیط های توزیع شده، موازی و چند عامله


چکیده:
امروزه با توجه به گسترش روز افزون اطلاعاتی که بشر با آنها سر و کار دارد، بهره­ گیری از روشهایی همچون داده­ کاوی برای استخراج دانش و اطلاعات نهفته در داده­ ها، امری غیرقابل اجتناب می­باشد. بدلیل حجم بسیار بالای داده ­ها در بسیاری از کاربردها و اهمیت بیشتر داده­ های جدید، ذخیره­ سازی این داده ­ها امری مقرون به صرفه نیست، لذا داده­ هایی که باید مورد پردازش قرار گیرند، همواره بصوت پویا در حال تغییر و تحول هستند. مساله دیگری که امروزه در بحث داده­ کاوی وجود دارد، بحث توزیع شدگی ذاتی داده ­ها است. معمولا پایگاه هایی که این داده­ ها را ایجاد یا دریافت می­کنند، متعلق به افراد حقیقی یا حقوقی هستند که هر کدام بدنبال اهداف و منافع خود می­باشند و حاضر نیستند دانش خود را بطور رایگان در اختیار دیگران قرار دهند.
با توجه به سیستم های چند عامله و مناسب بودن آنها برای محیط های پویا و توزیع شده بنظر می­رسد که بتوان از قابلیت های آنها برای داده ­کاوی در محیط های پویا و محیط های توزیع شده بهره برد. اکثر کارهایی که تاکنون در زمینه بهره ­گیری از عامل و سیستمهای چندعامله انجام شده است. خصوصیتهایی همانند خود آغازی و بخصوص متحرک بودن عاملها را مورد بررسی قرار داده است و در آنها مواردی همچون هوشمندی، یادگیری، قابلیت استدلال، هدف گرایی و قابلیتهای اجتماعی عاملها مورد بررسی قرار نگرفته است. در این تحقیق ما قصد داریم تا به بررسی کارهای موجود در زمینه کاربرد عامل و سیستمهای چند عامله در داده­ کاوی پرداخته و بحث طبقه­ بندی جریان داده ­ها را در یک محیط پویا را مورد بررسی قرار دهیم.
کلمات کلیدی: داده­ کاوی، طبقه ­بندی، جریان داده، عامل محیط توزیع شده

فهرست مطالب:
چکیده
1. فصل اول: معرفی و آشنایی با مفاهیم اولیه
1-1- مقدمه­ای بر داده­ کاوی
1-1-1- خوشه­ بندی
1-1-2- کشف قواعد وابستگی
1-1-3- طبقه ­بندی
1-1-3-1- طبقه ­بندی مبتنی بر قواعد
1-2- داده ­کاوی توزیع ­شده
1-3- عاملها و سیستمهای چند عامله
1-3-1- عامل
1-3-1-1- مقایسه عامل با شی
1-3-1-2- معماری عاملها
1-3-1-3- معماری BDI
1-3-2- سیستم­ های چند عامله
1-3-2-1- مذاکره
1-4- بهره­ گیری از عامل برای داده­ کاوی
1-4-1- سیستم­ های چند عامله، بستری برای داده­ کاوی توزیع شده
1-5- جمع­ بندی
2. فصل دوم: داده­ کاوی پویا
2-1- مقدم ه­ای بر داده­ کاوی پویا
2-2- جریان داده
2-3- طبقه ­بندی جریان داده24
2-3-1- موضوعات پژوهشی
2-4- جمع­ بندی
3. فصل سوم: مروری بر کارهای انجام شده
3-1- مقدمه
3-2- داده­ کاوی توزیع ­شده
3-2-1- روشهای غیرمتمرکز
3-2-2- روشهای مبتنی بر توزیع ذاتی داده­ ها
3-3- کارهای مهم انجام شده در زمینه داده ­کاوی با استفاده از عامل
3-4- کارهای انجام شده در زمینه طبقه­ بندی جریان داده­ ها
3-4-1- روشهای طبقه­ بندی Ensemble-based
3-4-2- درختهای تصمیم بسیار سریع
3-4-3- طبقه­ بندی On-Demand
3-4-4- OLIN
3-4-5- الگوریتمهای LWClass
3-4-6- الگوریتم ANNCAD
3-4-7- الگوریتم SCALLOP
3-4-8- طبقه­ بندی جریان داده­ها با استفاده از یک روش Rule-based
3-5- جمع ­بندی
 فهرست مراجع

تعداد مشاهده: 2060 مشاهده

فرمت فایل دانلودی:.docx

فرمت فایل اصلی: docx

تعداد صفحات: 60

حجم فایل:259 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب جهت استفاده دانشجویان رشته مهندسی کامپیوتر و فناوری اطاعات


  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    همراه با شکل، نمودار، جدول، فهرست شکل ها و منابع

پروژه درختان تصمیم گیری و مساله یادگیری


	پروژه درختان تصمیم گیری و مساله یادگیری


چکیده:
یادگیری درخت تصمیم یکی از رایج ترین تکنیک های یادگیری ماشین می باشد که به دلیل سادگی و کارامدی باعث شده است علی رغم مشکلاتی که در استفاده از آن همچون صفات دارای نویز و یا صفات فاقد مقدار یا ... وجود دارد به شکل گسترده ای در مسائل مربوط به یادگیری ماشین استفاده شود. در این تحقیق سعی شده است به مسائل اصلی مطرح در زمینهء درخت طراحی مانند بازنمایی، طراحی، عام سازی و مشکلات و راه کارهای برخورد با آنها که توسعه یافته اند پرداخته شود و همچنین از برخی مسائل غیراصلی مانند درختان رگراسیون، نرم افزارهای آزمایشگاهی و تست آماری χ2  نیز ذکری به میان آید. 

فهرست مطالب:
چکیده    
مقدمه     
1-1- اهداف اصلی درخت‌های تصمیم‌گیری دسته‌بندی کننده    
1-2- جذابیت درختان تصمیم    
1-3- انواع درختان تصمیم    
1-3-1- درختان رگراسیون    
2- بازنمایی درخت تصمیم    
2-1- توسعهء درختان تصمیم با گراف های تصمیم    
3- مسائل مناسب برای یادگیری درخت تصمیم    
4- چه صفتی بهترین طبقه بندی کننده است؟    
4-1-1- بی نظمی همگونی مثال ها را اندازه گیری می کند 
4-1-2- نفع اطلاعات، کاهش مورد انتظار در بی نظمی را اندازه گیری می کند
4-2- یک مثال تشریحی    
4-3- حالت خاصی از ساخت درخت تصمیم    
5- جستجوی فضای فرضیه در یادگیری درخت تصمیم    
5-1- قابلیت ها و محدودیت های الگوریتم ID3    
6- بایاس قیاسی (استنتاجی) در یادگیری درخت تصمیم    
6-1- بایاس های محدودیت و بایاس های ارجحیت    
6-2- چرا فرضیات کوتاهتر را ترجیح می دهیم؟    
7- مسائل در یادگیری درخت تصمیم    
7-1- اورفیتینگ داده ها    
7-2- روشهای موجود برای ممانعت از اورفیتینگ    
7-2-1- انواع روش های هرس کردن    
7-2-1-1- تست chi-Square    
7-2-2- هرس خطای کاهش یافته    
7-2-3- هرس بعدی قانون    
7-3- بکاربردن صفات با مقادیر پیوسته    
7-4- معیارهای دیگر برای انتخاب صفات     
7-5- بکاربردن مثال های آموزشی با صفات فاقد مقدار    
7-6- بکاربردن صفات با هزینه های متفاوت    
8- عام سازی درخت     
8-1- طراحی یک دسته بندی کنندهء درخت تصمیم    
8-2- روش‌های اصلی برای طراحی دسته بندی کنندهء درخت تصمیم    
9- انواع یادگیری در درخت تصمیم گیری    
10- مزایا و معایب درخت تصمیم    
10-1- مزایای درختان تصمیم نسبت به روش های دیگر داده کاوی    
10-2- معایب درختان تصمیم    
11- نرم افزارهای مفید برای درخت تصمیم    
12- الگوریتم یادگیری درخت تصمیم پایه    
13- جمع بندی    
14- لغت نامه     
15- مراجع

تعداد مشاهده: 2707 مشاهده

فرمت فایل دانلودی:.doc

فرمت فایل اصلی: doc

تعداد صفحات: 45

حجم فایل:755 کیلوبایت

 قیمت: 9,000 تومان
پس از پرداخت، لینک دانلود فایل برای شما نشان داده می شود.   پرداخت و دریافت فایل
  • راهنمای استفاده:
    مناسب برای دانشجویان رشته مهندسی کامپیوتر



  • محتوای فایل دانلودی:
    در قالب فایل word و قابل ویرایش
    به همراه اشکال و نمودارها