یادگیری ماشین (ML)

توسط مدیر سایت در مقالات » آمار و احتمال | ۱۰ اردیبهشت ۱۳۹۴ ساعت ۱۵:۵۱ | 0 نظر

نظریه احتمال یکی از جدیدترین رشته های تأسیس شده از ریاضیات است که در حال حاضر یک زمینه بسیار فعال پژوهشی می باشد. این زمینه، برنامه های متعددی در مدل سازی ریاضی برای علم کامپیوتر، امور مالی، مکانیک آماری، سیستم های دینامیکی، بیوانفورماتیک و غیره یافته است.

مباحث اصلی در نظریه احتمال شامل تئوری شرط بندی، فرآیندهای تصادفی، حساب دیفرانسیل و انتگرال تصادفی و... می شود. نظریه احتمال از بسیاری از زمینه های دیگر ریاضیات مانند تئوری اندازه گیری، نظریه یکپارچه سازی، تئوری نمایندگی، و تجزیه و تحلیل واقعی و پیچیده برگرفته شده است؛ و در مقابل دیدگاه های جالبی نسبت به ساختارهای جبری، هندسه گرافها، هندسه دیفرانسیل، تئوری ergodic، نظریه PDE و الگوریتم های نمونه گیری ارائه می دهد.

یادگیری ماشین (ML) یکی از حوزه های فرعی هوش مصنوعی است که در ایجاد ارتباط بین علوم کامپیوتر، آمار و نظریه احتمال تأثیر بسزایی دارد. ML در شرایط کلی، به طراحی، پیاده سازی، تجزیه و تحلیل، و استفاده از الگوریتم هایی مرتبط است که می توانند "از تجربه کردن یاد بگیرند."

در چند دهه گذشته، این حوزه با سرعت بسیار زیادی پیشرفت کرده است و در طیف گسترده ای از مسائل از جمله تجزیه و تحلیل زبان ("پردازش طبیعی زبان" یا NLP) و زبان شناسی، مدل سازی تغییرات ژنتیکی، مدل سازی کمّی در علوم اجتماعی، فیلتر هرزنامه ها، کشف خودکار سرقت هویت، و... کاربردی شده است.

با وجودی که ML یک حوزه پیچیده و گسترده است، می توان آن را به دو بخش تقسیم کرد: (1) برآورد (یا صحیح تر، "نظارت" ML) و (2) مدل سازی (یا، به شکل درست تر، "عدم نظارت" ML).

پیش بینی مسائل، مستلزم پیش بینی ارزش آینده ی برخی از متغیرهاست که قبلا مشاهدات بسیاری از آنها ارائه شده باشد. پیش بینی ارزش سهام با توجه به ارزش داده شده آن (و شرایط بازار) در طول یک سال، نمونه ای از آن است.
یکی از راه های اندیشیدن در مورد مسائل مدل سازی، برآورد مسائلی است که در آن متغیر مورد پیش بینی، به هیچ وجه مشاهده نشده است؛ پیش بینی ارزش سهام تنها با توجه به شرایط بازار، و بدون در نظر گرفتن ارزش قبلی آن، می تواند مثال مناسبی از یک مسأله مدل سازی باشد.

از یک دیدگاه مهم ریاضی، هر یک از جنبه های تئوریک و نرم افزاری ML (یا هر دوی آنها) می تواند بسیار جالب باشد.

مسائل تئوریک می توانند تجزیه و تحلیل الگوریتم های برآوردهای خاص را شامل شوند؛ چه در علم کامپیوتر و یا از دیدگاه آماری. تجزیه و تحلیل و طراحی روش های "استنتاجی" گام الگوریتمی مهمی در مدل سازی است که مقادیر مشاهده نشده مهم را از داده های مشاهده شده تخمین می زند. همچنین ارتباط مسائل یادگیری ماشینی با ایده هایی از تئوری اطلاعات، نظریه احتمال، و یا دیگر دامنه های تئوریک (و گاهی اوقات، نرم افزاری) نیز از این قبیل است.
مشکلات نرم افزاری، دربرگیرنده تمام طیف های مشتمل بر مسائلی است که نهایتاً در ارتباط با تجزیه و تحلیل داده های واقعی، درجه مشابهی از طیف ها را نشان می دهد؛ و می تواند شامل بکارگیری روشی از روشهای موجود برای حل مسائل جالب آنالیز داده ها، طراحی روشهایی نوین برای انواع جدیدی از آنالیزها، استفاده از روش های بدون نظارت برای حل مسائل تحت کنترل به شکل سنتی، و گستره ای از دیگر فعالیت های تحقیقاتی باشد.

لازم به ذکر است که تحقیقات ML از تعامل غنی و پرباری بین تئوری و عمل برخوردار است، به طوری که پروژه های تئوریک اغلب می توانند شامل یک جزء تجربی باشند در حالی که پروژه های کاربردی بیشتر اوقات نیازمند درک تئوری مربوطه [و حتی گاهی اوقات گسترش آن] هستند!

منبع: https://blogs.princeton.edu/mathclub/guide/courses/prob-stats

(گروه ریاضی دانشگاه پرینستون آمریکا)

یادگیری ماشین (ML)

نوشتن دیدگاه