چکیده
ارائه یک مدل جدید یادگیری به منظور آموزش طبقهبندیکنندههای سریال
امروزه ایجاد و آموزش بهینه دستهبندیکننده های مستحکم و سریع به یکی از مهمترین دغدغههای علم هوش مصنوعی و به ویژه حوزه یادگیری ماشین بدل شده است. با رشد روز افزون در حجم و سرعت تولید داده، نیاز به تولید دستهبندیکنندههای دقیق و سریع بیش از پیش حس می شود و در واقع یک چالش محسوب می شود. روشهای یادگیری جمعی طی سالیان اخیر اثبات کردهاند که برای رفع مشکلات یاد شده گزینههای مناسبی هستند.
روشهای یادگیری جمعی، گروهی از مدل های ضعیف را تولید میکنند که با تلفیق مناسب و هوشمندانه خروجی آنها می توان به یک دستهبندیکننده قوی دست یافت. این روشها زمانی که از الگوریتمهای تقویتی در ساختار سریال بهره میبرند، کارایی به مراتب بالاتری از خود نشان میدهند.
استفاده از شیوه تقسیم-و-تسخیر یا همان separate-and-conquer در زمان آموزش هر لایه از ساختار سریال، دلیل قدرت یادگیرهای جمعی سریال میباشد؛ علاوه بر آن، تعیین مرزهای تصمیم موارد جزیی در دورهای نخست ساختار سریال انجام میشود و در دورهای آتی این مرز پالایش شده و موارد سختتر را در بر خواهد گرفت. عملکرد مدل کلاسیک ساختار سریال، در مواجهه با مسائل دوکلاسه، به این صورت است که نمونههای غیر هدف که در لایههای اولیه یاد گرفته میشوند از سیستم حذف شده و با نمونههای سختتر جایگزین میشوند؛ که میتوان از این استراتژی با نام bootstrapping یاد کرد. با این روند، یادگیری بهینه کلان-به-جزیی یا همان learning coarse-to-fine حاصل میشود.
در این مطالعه، یک مدل نوین برای آموزش طبقهبندیکنندههای سریال ارایه شده است که از روش وارسی اعتبار در ساختار آن استفاده شده است. در روش پیشنهادی، درصدی از دادههای درست دستهبندیشده در لایه نخست ساختار به منظور حفظ عمومیت سیستم، برای آموزش به لایه بعدی فرستاده میشود و این روند برای لایههای بعدی ادامه خواهد یافت. بدین ترتیب، مدل ارائه شده در مقابل دادههای نویزی بسیار مقاوم بوده و انحراف معیار نرخ خطای آزمایش آن، از روشهای رقیب کمتر میشود.
واژههای کلیدی: یادگیری ماشین، الگوریتمهای یادگیری جمعی، coarse-to-fine learning، یادگیرهای جمعی سریال، separate-and-conquer
فهرست مطالب
عنوان صفحه
فصل اول
مقدمه
1-1. مقدمه. 1
1-2. یادگیری ماشین.. 1
1-3. الگوریتمهای یادگیری جمعی.. 3
1-4. دسته بندی کننده های سریال.. 4
1-5. ایده اصلی تحقیق.. 5
1-6. نگاهی کلی به فصول رساله. 6
فصل دوم
پیشینه تحقیق
2-1. مقدمه. 8
2-2. اهمیت مسائل چندکلاسه. 8
2-3. روشهای BOOSTING. 11
2-3-1. مسائل دوکلاسه. 13
2-3-2. مسائل چندکلاسه. 14
تکنیک های تجزیه کلاسی… 15
یکی-در مقابل-همه(OAA). 15
یکی-در مقابل-یکی(OAO). 16
روش P در مقابل Q… 17
روشهای Boosting چندکلاسه.. 18
روش AdaBoost.M2.. 18
روش AdaBoost.OC.. 21
روش AdaBoost.ECC.. 22
2-4. روشهای جمعی سریال.. 23
2-4-1. دستهبندیکنندهی سریال.. 24
دستهبندیکنندههای سریال همزمان… 28
ساختارهای سریال درختی… 30
2-5. خلاصه. 31
فصل سوم
راهکارهای پیشنهادی
3-1. مقدمه. 33
3-2. روش LogitBoost سریال تودرتو. 34
کلیات روش….. 34
جزییات روش….. 34
3-3. ساختار سریال پایش دادهها به کمک الگوریتم – نزدیکترینهمسایه. 39
3-4. خلاصه. 41
فصل چهارم
روال آزمایشها
4-1. مقدمه. 43
4-2. دستهبندیکنندههای مورد استفاده برای مقایسه. 43
4-2-1. دلایل انتخاب روشهای رقیب… 43
4-2-2. جزییات پیادهسازی روشهای رقیب… 44
4-3. معیارهای ارزیابی.. 46
4-4. مجموعه دادههای بهکار رفته در آزمایشها 48
مجموعه دادههای مربوط به مسائل چندکلاسه.. 48
مجموعه دادههای مربوط به مسائل دوکلاسه.. 49
4-5. تست آماری فریدمن.. 50
4-6. خلاصه. 52
فصل پنجم
نتایج
5-1. مقدمه. 54
5-2. نتایج حاصل از آزمایش هفت ترکیب مختلف از پارامترها برای روش پیشنهادی اول.. 54
5-2-1. تحلیل نتایج حاصل از آزمایش هفت ترکیب مختلف از پارامترها برای روش پیشنهادی اول.. 56
5-3. نتایج حاصل از آزمایش روش پیشنهادی اول و روشهای رقیب… 58
5-4. نتایج حاصل از آزمایش روش پیشنهادی دوم. 61
5-5. خلاصه. 63
فصل ششم
نتیجهگیری و کارهای آینده
6-1. نتیجهگیری.. 65
6-2. کارهای آینده 66
اختصارات………….. 67
واژه نامه فارسی به انگلیسی… 68
واژه نامه انگلیسی به فارسی… 72
فهرست منابع……. 76
فهرست جداول
عنوان صفحه
جدول 2-1.مثال از یک ماتریس کد گذاری به روش ECOC برای یک مساله چهار کلاسه 17
جدول 3-1.ترکیب پارامتری استفاده شده در راستای تحلیل تاثیر پارامترهای موجود در الگوریتم پیشنهادی اول…….. 39
جدول 4-1. جزییات مجموعه دادههای چندکلاسه.. 49
جدول 4-2. جزییات مجموعه دادههای دوکلاسه.. 50
جدول 5-1. مشخصات مجموعه دادههای استفاده شده برای بررسی تاثیر پارامترها در روش پیشنهادی اول……. 55
جدول 5-2.مقادیر آزمایشی ترکیبات مختلف پارامترها برای روش پیشنهادی اول 55
جدول 5-3.نرخ خطا و انحراف معیار بهدست آمده از ترکیبات مختلف پارامترها برای روش پیشنهادی اول ………………………………………………………………………………………….55
جدول 5-4.میانگین رتبه بندی برای 7 ترکیب پارامتری مقایسه شده بر 11 مجموعه داده چندکلاسه………. 58
جدول 5-5.تست فریدمن و تست تعقیبی Bonferroni-Dunn. برای 7 ترکیب پارامتری ، اختلافات معنادار با فونت توپر نمایش داده شده است. 58
جدول 5-6.نتایج حاصل از اعمال روش پیشنهادی اول و روشهای رقیب، در قالب نرخ خطای آزمایش و انحراف معیار 59
جدول 5-7.میانگین رتبه بندی برای 5 روش مقایسه شده بر 11 مجموعه داده چندکلاسه 60
جدول 5-8.نتایج تست فریدمن و تست تعقیبی Bonferroni-Dunn. برای روش پیشنهادی اول، اختلافات معنادار با فونت توپر نمایش داده شده است. 60
جدول 5-9. نتایج اعمال روش پیشنهادی دوم و روشKNN به ازای مقادیر مختلف k، در قالب نرخ خطای آزمایش و انحراف معیار 61
جدول 5-10.میانگین رتبه بندی برای 4 روش بر روی 12 مجموعه داده دوکلاسه 62
جدول 5-11.نتایج تست فریدمن و تست تعقیبی Bonferroni-Dunn. برای روش پیشنهادی دوم، اختلافات معنادار با فونت توپر نمایش داده شده است. 62
فهرست الگوریتمها
عنوان صفحه
الگوریتم 1.…….. شبه کد مربوط به روش AdaBoost. 14
الگوریتم 2.…….. شبه کد مربوط به روش AdaBoost.M2. 19
الگوریتم 3.…….. شبه کد مربوط به روش AdaBoost.OC. 21
الگوریتم 4.…….. شبه کد مربوط به روش AdaBoost.ECC. 23
الگوریتم 5.…….. ساختار سریال Viola-Jones. 25
الگوریتم 6.…….. شبه کد مربوط به فاز آموزش ساختار سریال پیشنهادی اول 38
الگوریتم 7.…….. شبهکد مربوط به الگوریتم LogitBoost برای مسائل چندکلاسه 46
فهرست شکل ها
عنوان صفحه
شکل 2-1. ساختار سریال Viola-Jones [42] 26
شکل 2-2. ساختار دستهبندیکننده سریال همزمان.. 29
شکل 2-3. ساختار درختی ارائه شده توسط لینهارت… 31
شکل 3-1. ساختار کلی روش دستهبندی سریال پیشنهادی اول.. 35
شکل 3-2. مکانیزم انتقال داده از یک لایه به لایه بعدی در روش پیشنهادی اول.. 37
شکل 3-3. ساختار سریال پیشنهادی دوم.. 40
تعداد صفحه :100 صفحه