دانشگاه اهایو
https://etd.ohiolink.edu/ap:1:100766165341125
florida:
http://etd.lib.fsu.edu/ETD-db/
دسترسی به متن کامل پایان نامه های 435 دانشگاه از24 کشور اروپایی
http://www.dart-europe.eu/basic-search.php
دسترسی رایگان به بانک مقالات دانشگاه کالیفرنیا
http://escholarship.org/
دسترسی رایگان به بانک مقالات دانشگاه TENNESSEE
http://www.lib.utk.edu:90/cgi-perl/dbBroker.cgi?help=148
دسترسی رایگان به 1,550,632 مقاله ی دانشگاهی
http://www.oalib.com/
دسترسی به پایان نامه های الکترونیکی دانشگاه ناتینگهام
http://etheses.nottingham.ac.uk/
دسترسی رایگان به کتاب ها و ژورنال های سایت In Tech
http://www.intechopen.com/
دسترسی رایگان به مقالات علمی -- دانشگاه McGill
http://digitool.library.mcgill.ca/R
دسترسی رایگان به مقالات علمی -- مقالات 1753 ژورنال--- دانشگاه استنفورد
http://highwire.stanford.edu/
Directory of Open Access Journals
http://www.doaj.org/
دسترسی به مقالات و متون علمی پایگاه Proceeding of the National Academy of Sciences ایالت متحده ی آمریکا
http://www.pnas.org/
Over 80 million free scientific publications
http://www.freefullpdf.com/
دسترسی رایگان به مقالات Trakia Journal of Sciences
http://tru.uni-sz.bg/tsj/
دانلود رایگان تز از Ludwig Maximilians Universitat Munchen
http://edoc.ub.uni-muenchen.de/cgi/search/advanced
لینک پیشنهادی استاد برای یادگیری بهتر مطالب که البته مربوط به شرکت Lionsolver می باشد و شامل حل یکسری homework می باشد.
انجام این تمرین جهت آشنائی بیشتر با یادگیری درخت تصمیم از طریق استفاده از آن در یک مثال عملی میباشد. برای انجام این تمرین میتوانیداز برنامه Weka برای پیادهسازی درخت تصمیم استفاده کنید.
اطلاعات بیشتر در مورد این برنامه در مکانهای زیرموجود است.
WEKA API User Guide
در این تمرین روش reduced error pruning را برای هرس کردن درخت اعمال کنید.
داده مورد استفاده:
برای انجام این تمرین میتوا نید از مجموعه داده adult از دیتا بیس UCI استفاده کنید. این مجموعه داده دارای 14 ویژگی است که6 ویژگی پیوسته و بقیه گسسته میباشند. برای سهولت کار میتوانید از دادههائی که فاقد مقادیر برخی ویژگیها هستند صرف نظر کنید. هدف یادگیری این است که بر اساس سایر ویژگیها پیش بینی شود که آیا یک شخص دارای درآمدی بیش از50k است یا خیر.
سوالات
1. مجموعه مثالهای adult را بصورت تصادفی به 10 مجموعه مساوی ولی غیر تکراری تقسیم کنید. به ازای هر یک از 9 مجموعه حاصل یک درخت تصمیم ایجاد کرده و از مجموعه دهم برای تست استفاده کنید. نموداری از خطاهای حاصل را رسم کرده و روی نتیجه بحث کنید.
2. عملکرد درخت را بر اساس تعداد مثالهای آموزشی بصورت گراف رسم کنید. (منحنی آموزش)
3. نتیجه را برای درختهای هرس شده و هرس نشده مقایسه کنید. اختلاف بین تعداد ویژگیهای درخت هرس شده و نشده را مشخص کنید.
4. برای انتخاب ویژگی مناسب برای هر گره علاوه بر روش استفاده از Information Gain روشهای زیر را نیز پیادهسازی کنید:
· تصادفی Random که در آن یکی از ویژگیها بصورت تصادفی انتخاب میشوند.
· نسبت بهره Gain Ratio (فرمول 3.6 کتاب).
· هنگام استفاده از برنامه باید بتوانید هر یک از روشهای فوق را انتخاب کنید.
5. با انتخاب تعداد متفاوتی مثال یادگیری برنامه را با استفاده از معیار تصادفی، بهره اطلاعات و نسبت اطلاعات بر روی یک مجموعه داده اجرا کرده و نتیجه را مقایسه کنید. برای معیار تصادفی هیستوگرام سایز درخت تولید شده را برای 20 بار تکرار آزمایش رسم کنید.
آنچه که تحویل میدهید:
· یک فایل متنی به نام report.doc حاوی:
1. گزارشی شامل پاسخهای داده شده به هر یک از سوالات فوق.
2. توضیح هر گونه آزمایش یا مقایسه دیگری که بر روی دادهها انجام دادهاید.
نحوه تحویل:
فایل فوق را در فایلی به نام ML_xxx_P2_YourName.zip ذخیره نموده این فایل را تا موعد مقرر به آدرس mehrnoosh.bazrafkan@gmail.com ارسال نمایید. عنوان(subject) ایمیل را نیز ML_xxx_P2_YourName.zip قرار دهید. لازم به ذکر است که به جای YourName نام و نام خانوادگیخود را در اسم فایل قرار دهید و به جای xxx شماره ترم اخذ درس را قرار دهید (مثلا برای نیمسال اول 88 به جای xxx باید 881 قرار گیرد). تمام اجزای اسم فایل را انگلیسی تایپ نمایید.
دانشجویان عزیز توجه داشته باشند که برای بوحود آمدن امکان ارزیابی صحیح کار انجام شده لازم است تا هر دانشجو آزمایشات را جداگانه انجام داده و نتایج جداگانهای را نیز ارائه نماید.
در ضمن بصورت تصادفی از یک و یا چند دانشجو خواسته خواهد شد تا کار انجام شده را در کلاس درس توضیح بدهند.
1- الگوریتم حذف کاندید را بر روی مثالهای جدول 2-1 با ترتیب معکوس اعمال کرده و محدوده های S,G بدست آمده را بنویسید. چرا VS بدست آمده با فضای بدست آمده قبلی یکسان است؟ آیا میتوانید ایده ای برای مرتب کردن مثالها ارائه دهید که باعث کمتر شدن S,G میانی شود؟
2- تمرینهای زیر را از کتاب درس حل کنید: 2-3, 2-4, 2-6
نحوه تحویل:
فایل فوق را در فایلی به نام ML_xxx_P1_YourName.zip ذخیره نموده این فایل را تا موعد مقرر به آدرس mehrnoosh.bazrafkan@gmail.comارسال نمایید. عنوان(subject) ایمیل را نیز ML_xxx_P1_YourName.zip قرار دهید. لازم به ذکر است که به جای YourName نام و نام خانوادگیخود را در اسم فایل قرار دهید و به جای xxx شماره ترم اخذ درس را قرار دهید (مثلا برای نیمسال اول 88 به جای xxx باید 881 قرار گیرد). تمام اجزای اسم فایل را انگلیسی تایپ نمایید.
http://s4.picofile.com/file/7963385806/A_new_approach_for_Persian_spellchecking.pdf.html
http://s2.picofile.com/file/7963392468/Asgari_Chappelier_Analysis_of_Persian_poems_with_computational_linguistics_tools_ICIL5.pdf.html
http://s3.picofile.com/file/7963409244/BergKirkpatrick_Burkett_Klein_2012_Significance_paper.pdf.html
http://s3.picofile.com/file/7963410321/EventExtraction_V2_2.pdf.html
http://s2.picofile.com/file/7963411070/ijcnlp13.pdf.html
http://s3.picofile.com/file/7963412147/ijcnlp2013_camera_ready_final.pdf.html
http://s3.picofile.com/file/7963413010/J96_3013.pdf.html
http://s2.picofile.com/file/7963452040/NAACL_HLT_2009_Xu.pdf.html
http://s3.picofile.com/file/7963453117/Persian_Dependency_Parsing.pdf.html
http://s4.picofile.com/file/7963471284/Rasooli_et_al_NAACL_HLT2013.pdf.html
http://s3.picofile.com/file/7963471719/tops12001.pdf.html
http://s2.picofile.com/file/7963473438/Language_Indepedent_Bayesian_Sentiment_Mining_of_Twitter.pdf.html
http://s2.picofile.com/file/7963483117/RANLP_main_1.pdf.html
سایت زیر متعلق به آقای Hagan نویسنده کتاب شبکه های عصبی است.