پایان نامه رشته کامپیوتر - ارائه یک مدل جدید یادگیری به منظور آموزش طبقه‌ بندی‌کننده‌ های سریال


چکیده

ارائه یک مدل جدید یادگیری به منظور آموزش طبقه‌بندی‌کننده‌های سریال

امروزه ایجاد و آموزش بهینه دسته‌بندی‌کننده های مستحکم و سریع به یکی از مهمترین دغدغه‌های علم هوش مصنوعی و به ویژه حوزه یادگیری ماشین بدل شده است. با رشد روز افزون در حجم و سرعت تولید داده، نیاز به تولید دسته‌بندی‌کننده‌های دقیق و سریع بیش از پیش حس می شود و در واقع یک چالش محسوب می شود. روش‌های یادگیری جمعی طی سالیان اخیر اثبات کرده‌اند که برای رفع مشکلات یاد شده گزینه‌های مناسبی هستند.

روش‌های یادگیری جمعی، گروهی از مدل های ضعیف را تولید می‌کنند که با تلفیق مناسب و هوشمندانه خروجی آنها می توان به یک دسته‌بندی‌کننده قوی دست یافت. این روش‌ها زمانی که از الگوریتم‌های تقویتی در ساختار سریال بهره می‌برند، کارایی به مراتب بالاتری از خود نشان می‌دهند.

استفاده از شیوه تقسیم-و-تسخیر یا همان separate-and-conquer در زمان آموزش هر لایه از ساختار سریال، دلیل قدرت یادگیر‌های جمعی سریال می‌باشد؛ علاوه بر آن، تعیین مرزهای تصمیم موارد جزیی در دور‌های نخست ساختار سریال انجام می‌شود و در دور‌های آتی این مرز پالایش شده و موارد سخت‌تر را در بر خواهد گرفت. عملکرد مدل کلاسیک ساختار سریال، در مواجهه با مسائل دوکلاسه، به این صورت است که نمونه‌های غیر هدف که در لایه‌های اولیه یاد گرفته می‌شوند از سیستم حذف شده و با نمونه‌های سخت‌تر جایگزین می‌شوند؛ که می‌توان از این استراتژی با نام bootstrapping یاد کرد. با این روند، یادگیری بهینه کلان-به-جزیی یا همان learning coarse-to-fine حاصل می‌شود.

در این مطالعه، یک مدل نوین برای آموزش طبقه‌بندی‌کننده‌های سریال ارایه شده است که از روش وارسی اعتبار در ساختار آن استفاده شده است. در روش پیشنهادی، درصدی از داده‌های درست دسته‌بندی‌شده در لایه‌ نخست ساختار به منظور حفظ عمومیت سیستم، برای آموزش به لایه بعدی فرستاده می‌شود و این روند برای لایه‌های بعدی ادامه خواهد یافت. بدین ترتیب، مدل ارائه شده در مقابل داده‌های نویزی بسیار مقاوم بوده و انحراف معیار نرخ خطای آزمایش آن، از روش‌های رقیب کمتر می‌شود.

واژه­های کلیدی: یادگیری ماشین، الگوریتم­های یادگیری جمعی، coarse-to-fine learning، یادگیر‌های جمعی سریال، separate-and-conquer

 

 

فهرست مطالب

 

عنوان                                                                                                                صفحه

فصل اول  

مقدمه  

  1. مقدمه…………………………………………………………………………………………………………………………………1

1-1. مقدمه. 1

1-2. یادگیری ماشین.. 1

1-3. الگوریتمهای یادگیری جمعی.. 3

1-4. دسته بندی کننده های سریال.. 4

1-5. ایده اصلی تحقیق.. 5

1-6. نگاهی کلی به فصول رساله. 6

فصل دوم  

پیشینه تحقیق   

  1. پیشینه تحقیق …………………………………………………………………………………………………………………..8

2-1. مقدمه. 8

2-2. اهمیت مسائل چندکلاسه. 8

2-3. روش‌های BOOSTING. 11

2-3-1. مسائل دوکلاسه. 13

2-3-2. مسائل چند‌کلاسه. 14

تکنیک های تجزیه کلاسی… 15

یکی-در مقابل-همه(OAA). 15

یکی-در مقابل-یکی(OAO). 16

روش P در مقابل Q… 17

روش‌های Boosting چند‌کلاسه.. 18

روش AdaBoost.M2.. 18

روش AdaBoost.OC.. 21

روش AdaBoost.ECC.. 22

2-4. روش‌های جمعی سریال.. 23

2-4-1. دسته‌بندی‌‌‌کننده‌ی سریال.. 24

دسته‌بندی‌کننده‌های سریال همزمان… 28

ساختار‌های سریال درختی… 30

2-5. خلاصه. 31

فصل سوم  

راهکارهای پیشنهادی

  1. راهکارهای پیشنهادی… 33

3-1. مقدمه. 33

3-2. روش LogitBoost سریال تودرتو. 34

کلیات روش….. 34

جزییات روش….. 34

3-3. ساختار سریال پایش داد‌ه‌ها به کمک الگوریتم – نزدیک‌ترین‌همسایه. 39

3-4. خلاصه. 41

فصل چهارم  

روال آزمایش‌ها 

  1. روال آزمایش‌‌ها ………………………………………………………………………………………………………………..43

4-1. مقدمه. 43

4-2. دسته‌بندی‌کننده‌های مورد استفاده برای مقایسه. 43

4-2-1. دلایل انتخاب روش‌های رقیب… 43

4-2-2. جزییات پیاده‌سازی روش‌های رقیب… 44

4-3. معیار‌های ارزیابی.. 46

4-4. مجموعه داده‌های به‌کار رفته در آزمایش‌ها 48

مجموعه داده‌های مربوط به مسائل چندکلاسه.. 48

مجموعه داد‌ه‌های مربوط به مسائل دوکلاسه.. 49

4-5. تست آماری فریدمن.. 50

4-6. خلاصه. 52

فصل پنجم  

نتایج   

  1. نتایج……………………………………………………………………………………………………………………………….54

5-1. مقدمه. 54

5-2. نتایج حاصل از آزمایش هفت ترکیب مختلف از پارامترها برای روش پیشنهادی اول.. 54

5-2-1. تحلیل نتایج حاصل از آزمایش هفت ترکیب مختلف از پارامترها برای روش پیشنهادی اول.. 56

5-3. نتایج حاصل از آزمایش روش پیشنهادی اول و روش‌های رقیب… 58

5-4. نتایج حاصل از آزمایش روش پیشنهادی دوم. 61

5-5. خلاصه. 63

فصل ششم  

نتیجه‌گیری و کارهای آینده

  1. 6. نتیجه‌گیری و کارهای آینده. 65

6-1. نتیجه‌گیری.. 65

6-2. کارهای آینده 66

اختصارات………….. 67

واژه نامه فارسی به انگلیسی… 68

واژه نامه انگلیسی به فارسی… 72

فهرست منابع……. 76

 

فهرست جداول

 

عنوان                                                                                                                صفحه

 

جدول 2-1.مثال از یک ماتریس کد گذاری به روش ECOC برای یک مساله چهار کلاسه   17

جدول 3-1.ترکیب پارامتری استفاده شده در راستای تحلیل تاثیر پارامترهای موجود در الگوریتم پیشنهادی اول…….. 39

جدول 4-1.     جزییات مجموعه داده‌‌های چندکلاسه.. 49

جدول 4-2.     جزییات مجموعه داده‌های دوکلاسه.. 50

جدول 5-1.      مشخصات مجموعه داده‌های استفاده شده برای بررسی تاثیر پارامترها در روش پیشنهادی اول……. 55

جدول 5-2.مقادیر آزمایشی ترکیبات مختلف پارامترها برای روش پیشنهادی اول   55

جدول 5-3.نرخ خطا و انحراف معیار به‌دست آمده از ترکیبات مختلف پارامترها برای روش پیشنهادی اول   ………………………………………………………………………………………….55

جدول 5-4.میانگین رتبه بندی برای 7 ترکیب پارامتری مقایسه شده بر 11 مجموعه داده چندکلاسه………. 58

جدول 5-5.تست فریدمن و تست تعقیبی Bonferroni-Dunn. برای  7 ترکیب پارامتری ، اختلافات معنادار با فونت توپر نمایش داده شده است. 58

جدول 5-6.نتایج حاصل از اعمال روش‌‌ پیشنهادی اول و روش‌های رقیب، در قالب نرخ خطای آزمایش و انحراف معیار  59

جدول 5-7.میانگین رتبه بندی برای 5 روش مقایسه شده بر 11 مجموعه داده چندکلاسه   60

جدول 5-8.نتایج تست فریدمن و تست تعقیبی Bonferroni-Dunn. برای روش پیشنهادی اول، اختلافات معنادار با فونت توپر نمایش داده شده است. 60

جدول 5-9. نتایج اعمال روش پیشنهادی دوم و روشKNN  به ازای مقادیر مختلف k، در قالب نرخ خطای آزمایش و انحراف معیار  61

جدول 5-10.میانگین رتبه بندی برای 4 روش بر روی 12 مجموعه داده دوکلاسه   62

جدول 5-11.نتایج تست فریدمن و تست تعقیبی Bonferroni-Dunn. برای روش پیشنهادی دوم، اختلافات معنادار با فونت توپر نمایش داده شده است. 62

 

فهرست الگوریتم‌ها

عنوان                                                                                                                صفحه

الگوریتم 1.…….. شبه کد مربوط به روش AdaBoost. 14

الگوریتم 2.…….. شبه کد مربوط به روش AdaBoost.M2. 19

الگوریتم 3.…….. شبه کد مربوط به روش AdaBoost.OC. 21

الگوریتم 4.…….. شبه کد مربوط به روش AdaBoost.ECC. 23

الگوریتم 5.…….. ساختار سریال Viola-Jones. 25

الگوریتم 6.…….. شبه کد مربوط به فاز آموزش ساختار سریال پیشنهادی اول   38

الگوریتم 7.…….. شبهکد مربوط به الگوریتم LogitBoost برای مسائل چندکلاسه  46

 

 

فهرست شکل ها

 

عنوان                                                                      صفحه

شکل 2-1.         ساختار سریال Viola-Jones [42] 26

شکل 2-2.         ساختار دسته‌بندی‌کننده‌ سریال همزمان.. 29

شکل 2-3.         ساختار درختی ارائه شده توسط لینهارت… 31

شکل 3-1.         ساختار کلی روش دسته‌بندی‌ سریال پیشنهادی اول.. 35

شکل 3-2.         مکانیزم انتقال داده از یک لایه به لایه بعدی در روش پیشنهادی اول.. 37

شکل 3-3.         ساختار سریال پیشنهادی دوم.. 40

تعداد صفحه :100 صفحه


دانلود فایل