وبلاگ دانشجویان هوش مصنوعی پردیس علوم و تحقیقات بوشهر

وبلاگ دانشجویان هوش مصنوعی پردیس علوم و تحقیقات بوشهر

پل ارتباطی دانشجویان با استاد بذرافکن
وبلاگ دانشجویان هوش مصنوعی پردیس علوم و تحقیقات بوشهر

وبلاگ دانشجویان هوش مصنوعی پردیس علوم و تحقیقات بوشهر

پل ارتباطی دانشجویان با استاد بذرافکن

تمرین شماره 2: درخت تصمیم یادگیری

انجام این تمرین جهت آشنائی بیشتر با یادگیری درخت تصمیم از طریق استفاده از آن در یک مثال عملی می‌باشد. برای انجام این تمرین می‌توانیداز برنامه Weka برای پیاده‌سازی درخت تصمیم استفاده کنید.

اطلاعات بیشتر در مورد این برنامه در مکانهای زیرموجود است.

WEKA Machine Learning Project

WEKA API User Guide

در این تمرین روش reduced error pruning را برای هرس کردن درخت اعمال کنید.

داده مورد استفاده:

برای انجام این تمرین می‌توا نید از مجموعه داده adult از دیتا بیس UCI استفاده کنید. این مجموعه داده دارای 14 ویژگی است که6 ویژگی پیوسته و بقیه گسسته می‌باشند. برای سهولت کار می‌توانید از داده‌هائی که فاقد مقادیر برخی ویژگی‌ها هستند صرف نظر کنید. هدف یادگیری این است که بر اساس سایر ویژگیها پیش بینی شود که آیا یک شخص دارای درآمدی بیش از50k است یا خیر.

سوالات

1. مجموعه مثالهای adult را بصورت تصادفی به 10 مجموعه مساوی ولی غیر تکراری تقسیم کنید. به ازای هر یک از 9 مجموعه حاصل یک درخت تصمیم ایجاد کرده و از مجموعه دهم برای تست استفاده کنید. نموداری از خطاهای حاصل را رسم کرده و روی نتیجه بحث کنید.

2. عملکرد درخت را بر اساس تعداد مثالهای آموزشی بصورت گراف رسم کنید. (منحنی آموزش)

3. نتیجه را برای درخت‌های هرس شده و هرس نشده مقایسه کنید. اختلاف بین تعداد ویژگی‌های درخت هرس شده و نشده را مشخص کنید.

4. برای انتخاب ویژگی مناسب برای هر گره علاوه بر روش استفاده از Information Gain روشهای زیر را نیز پیاده‌سازی کنید:

·  تصادفی Random که در آن یکی از ویژگی‌ها بصورت تصادفی انتخاب می‌شوند.

·         نسبت بهره Gain Ratio (فرمول 3.6 کتاب).

·  هنگام استفاده از برنامه باید بتوانید هر یک از روشهای فوق را انتخاب کنید.

5. با انتخاب تعداد متفاوتی مثال یادگیری برنامه را با استفاده از معیار تصادفی، بهره اطلاعات و نسبت اطلاعات بر روی یک مجموعه داده اجرا کرده و نتیجه را مقایسه کنید. برای معیار تصادفی هیستوگرام سایز درخت تولید شده را برای 20 بار تکرار آزمایش رسم کنید.

 آنچه که تحویل می‌دهید:

·         یک فایل متنی به نام report.doc حاوی:

1.  گزارشی شامل پاسخهای داده شده به هر یک از سوالات فوق.

2. توضیح هر گونه آزمایش یا مقایسه دیگری که بر روی داده‌ها انجام داده‌اید.

نحوه تحویل:

فایل فوق را در فایلی به نام ML_xxx_P2_YourName.zip ذخیره نموده این فایل را تا موعد مقرر به آدرس mehrnoosh.bazrafkan@gmail.com ارسال نمایید. عنوان(subject) ایمیل را نیز ML_xxx_P2_YourName.zip قرار دهید. لازم به ذکر است که به جای YourName نام و نام خانوادگی‌خود را در اسم فایل قرار دهید و به جای xxx شماره ترم اخذ درس را قرار دهید (مثلا برای نیمسال اول 88 به جای xxx باید 881 قرار گیرد). تمام اجزای اسم فایل را انگلیسی تایپ نمایید.

دانشجویان عزیز توجه داشته باشند که برای بوحود آمدن امکان ارزیابی صحیح کار انجام شده لازم است تا هر دانشجو آزمایشات را جداگانه انجام داده و نتایج جداگانه‌ای را نیز ارائه نماید.

در ضمن بصورت تصادفی از یک و یا چند دانشجو خواسته خواهد شد تا کار انجام شده را در کلاس درس توضیح بدهند.

تمرین شماره 1 - درس یادگیری ماشین

1-  الگوریتم حذف کاندید را بر روی مثالهای جدول 2-1 با ترتیب معکوس اعمال کرده و محدوده های S,G بدست آمده را بنویسید.  چرا VS  بدست آمده با فضای بدست آمده قبلی یکسان است؟ آیا میتوانید ایده ای برای مرتب کردن مثالها ارائه دهید که باعث کمتر شدن S,G  میانی شود؟

2-  تمرینهای زیر را از کتاب درس حل کنید:   2-3, 2-4, 2-6

نحوه تحویل:

فایل فوق را در فایلی به نام ML_xxx_P1_YourName.zip ذخیره نموده این فایل را تا موعد مقرر به آدرس mehrnoosh.bazrafkan@gmail.comارسال نمایید. عنوان(subject) ایمیل را نیز ML_xxx_P1_YourName.zip قرار دهید. لازم به ذکر است که به جای YourName نام و نام خانوادگی‌خود را در اسم فایل قرار دهید و به جای xxx شماره ترم اخذ درس را قرار دهید (مثلا برای نیمسال اول 88 به جای xxx باید 881 قرار گیرد). تمام اجزای اسم فایل را انگلیسی تایپ نمایید.

قابل توجه دانشجویان شبکه های عصبی

سایت زیر متعلق به آقای Hagan نویسنده کتاب شبکه های عصبی است.

http://hagan.okstate.edu/nnd.html