در این مطلب بطور جامع، کامل و با ذکر مثال دو مفهوم مهم در یادگیری ماشین یا ماشین لرنینگ با عنوان یادگیری تحت نظارت و یادگیری بدون نظارت ارائه می شود.

یادگیری ماشین تحت نظارت چیست؟

در یادگیری تحت نظارت (Supervised Learning)، شما با استفاده از داده ­ای که به خوبی برچسب­ گذاری شده است، به ماشین آموزش می ­دهید؛ یعنی برخی از داده ­ها با پاسخ درست، برچسب­ گذاری شده­ اند. این روش می ­تواند با یادگیری که در حضور یک سرپرست یا معلم انجام می ­شود، مقایسه گردد.

الگوریتم یادگیری تحت نظارت، از داده­ های آموزشی دارای برچسب (لیبل دار) یاد می­گیرد و به شما کمک می­ کند تا خروجی­ ها را برای داده ­ی پیش­بینی نشده، پیش بینی کنید. ساخت موفقیت ­آمیز، مقیاس دهی و اعمال مدل یادگیری ماشین تحت نظارت دقیق، زمان می ­برد و به تخصص فنی گروهی از محققان داده­ ی دارای مهارت نیاز دارد. علاوه بر این، محققان داده، باید مدل­ ها را مجدداً بسازند تا مطمئن شوند که تا زمانی که داده تغییر نکند، خروجی ثابت می ­ماند.

یادگیری بدون نظارت چیست؟

یادگیری بدون نظارت (Unsupervised Learning)، یک روش یادگیری ماشین است که در آن شما نیاز به نظارت به مدل ندارید. در عوض، شما نیاز دارید که به مدل اجازه دهید که روی خودش کار کند تا اطلاعات را بیابد. این روش، عمدتاً با داده ­های بدون برچسب سر و کار دارد.

الگوریتم ­های یادگیری بدون نظارت، به شما اجازه می ­دهند که در مقایسه با یادگیری تحت نظارت، کارهای پردازشی پیچیده ­تری انجام دهید. اگرچه، یادگیری بدون نظارت می­ تواند در مقایسه با سایر روش­ های یادگیری طبیعی، یادگیری عمیق (deep learning) و یادگیری تقویتی (reinforcement learning)، غیر قابل پیش­بینی ­تر باشد.

چرا یادگیری تحت نظارت؟

  • یادگیری تحت نظارت به شما اجازه می­ دهد تا داده ­ها را جمع ­آوری کنید یا یک خروجی داده را از تجربه ­ی قبلی تولید کنید.
  • به شما کمک می­ کند که معیارهای عملکرد را با استفاده از تجربه، بهینه کنید.
  • یادگیری تحت نظارت به شما کمک می­ کند تا انواع مختلف مشکلات محاسباتی در دنیای واقعی را حل کنید.

چرا یادگیری بدون نظارت؟

در اینجا، دلایل اصلی برای یادگیری بدون نظارت آورده شده است:

  • یادگیری بدون نظارت، همه­ ی انواع الگوهای ناشناخته در داده را پیدا می­کند.
  • یادگیری بدون نظارت به شما کمک می ­کند تا ویژگی­هایی را بیابید که می ­توانند برای طبقه­ بندی مفید باشند.
  • این امر به صورت بلادرنگ و در زمان واقعی انجام می­شود و تمام داده ­های ورودی نیز که باید در حضور یاد گیرنده، تحلیل و برچسب­ گذاری شوند، این‌گونه هستند.
  • آسان­تر است که از کامپیوتر، داده ­های بدون برچسب را نسبت به داده ­های برچسب­ گذاری ­شده که نیاز به دخالت دستی دارند، گرفت.

یادگیری تحت نظارت، چگونه کار می­کند؟

برای مثال، شما می­خواهید به یک ماشین آموزش دهید تا به شما کمک کند که پیش­بینی کنید که چقدر طول خواهد کشید تا شما از محل کار خود، به خانه رانندگی کنید. اینجا، شما با ساختن مجموعه ­ای از داده ­های برچسب­ گذاری شده شروع می­ کنید. این داده ­ها شامل موارد زیر هستند:

  • شرایط آب و هوا
  • زمان روز
  • تعطیلات

زانندگی

تمام این جزئیات، ورودی ­های شما هستند. خروجی، مقدار زمانی است که طول می ­کشد تا در یک روز خاص، به سمت خانه رانندگی کنید. شما به طور غریزی می ­دانید که اگر بیرون باران ببارد، زمان رانندگی شما به خانه، بیشتر طول خواهد کشید؛ اما ماشین به داده ­ها و محاسبات نیاز دارد.

بیایید ببینیم که چگونه می ­توانید یک مدل یادگیری تحت نظارت، برای این مثال اجرا کنید که به کاربر کمک کند تا زمان رفت و آمد را تعیین کند. اولین چیزی که شما نیاز دارید تا درست کنید، مجموعه داده ­ی آموزشی است. این مجموعه­ ی آموزشی، شامل مجموع زمان رفت ­و ­آمد و فاکتورهای متناظر، مانند آب و هوا، زمان و … خواهد بود. بر اساس این مجموعه­ ی آموزشی، ماشین شما ممکن است رابطه­ ی مستقیمی بین مقدار باران و زمانی که طول می ­کشد تا به خانه برسید، ببیند.

بنابراین، معلوم می ­شود که هرچه بیشتر باران ببارد، شما باید زمان بیشتری را برای رانندگی تا خانه صرف کنید. همچنین، این ماشین، ممکن است ارتباطی بین زمانی که شما محل کار را ترک می ­کنید و زمانی که در جاده خواهید بود، بیابد.

هر چه زمان ترک شما، به ساعت ۶ بعدازظهر نزدیک ­تر باشد، برای شما بیشتر طول خواهد کشید تا به خانه برسید. ماشین شما ممکن است روابطی بین بعضی از داده های برچسب­ گذاری شده ­ی شما پیدا کند.

این مرحله، آغاز مدل داده ­ی شما است. این مدل، شروع به بررسی چگونگی اثرگذاری باران روی روش رانندگی مردم می­ کند. همچنین، این مدل شروع می ­کند تا ببیند که مردم بیشتری، در طول یک زمان خاص از روز، عبور و مرور می ­کنند.

یادگیری تحت نظارت

 

یادگیری بدون نظارت، چگونه کار می­کند؟

بیایید یک کودک و سگ خانوادگی او را به عنوان یک مورد در نظر بگیریم.

کودک و سگ

 

او این سگ را می­شناسد و می ­تواند شناسایی کند. چند هفته بعد، یک دوست خانوادگی، یک سگ را می­ آورد و تلاش می ­کند که با کودک بازی کند.

کودک، قبل از این، این سگ را ندیده بود؛ اما ویژگی ­های بسیاری را می ­شناسد (دو گوش، چشم­ها، راه رفتن روی چهارپا) که شبیه به سگ خانگی او است. او یک حیوان جدید شبیه به سگ، شناسایی می­ کند. این یادگیری بدون نظارت است، جایی که به شما آموزش داده نشده، اما شما از داده ­ها یاد می گیرید (در این مورد، درباره ­ی سگ). اگر این روش، یادگیری تحت نظارت بود، دوست خانواده باید به کودک می­ گفت که این، یک سگ است.

انواع تکنیک­های یادگیری ماشین تحت نظارت

رگریسیون تحت نظارت

رگرسیون یا بازگشت (Regression):

روش رگرسیون، یک مقدار خروجی تنها را با استفاده از داده­ ی آموزشی پیش ­بینی می­کند.

مثال: شما می­توانید از رگرسیون برای پیش­بینی قیمت خانه با استفاده از داده ­ی آموزشی، استفاده کنید. متغیرهای ورودی، محل، اندازه ­ی خانه و … خواهند بود.

طبقه­ بندی (Classification):

طبقه ­بندی به این معناست که خروجی را درون یک دسته یا کلاس، گروه ­بندی کرد. اگر الگوریتم تلاش کند تا ورودی را در دو کلاس مختلف قرار دهد، طبقه ­بندی دودویی نامیده می ­شود. انتخاب بین بیش از چند کلاس نیز، به نام طبقه ­بندی چند کلاسه شناخته می­شود.

مثال: تعیین اینکه آیا فردی وام را پرداخت می­کند یا خیر.

نقاط قوت: خروجی­ ها همیشه یک تعبیر احتمالی دارند و الگوریتم می ­تواند به گونه ­ای نظم داده شود که از مشکل پوشش بیش از حد یا overfitting جلوگیری کند.

نقاط ضعف: رگرسیون استدلالی ممکن است کمتر از حد انتظار کار کند، زمانی که مرزهای تصمیم ­گیری غیرخطی یا چندگانه باشند. این روش، منعطف نیست، بنابراین نمی­ تواند روابط پیچیده­ تر را ثبت و ضبط کند.

انواع تکنیک­های یادگیری ماشین بدون نظارت

مسئله­ های یادگیری بدون نظارت، به مسائل خوشه بندی (clustering) و پیوستگی (association) تقسیم می­شود.

خوشه­ بندی

خوشه­ بندی، مفهوم مهمی در یادگیری بدون نظارت است. این روش، اساساً یک ساختار یا الگو را در یک مجموعه داده ­ی طبقه ­بندی ­نشده پیدا می­کند. الگوریتم ­های خوشه­ بندی، داده ­ی شما را پردازش کرده و خوشه­ ها (گروه ­ها) ی طبیعی را در صورت وجود، پیدا می ­کنند.

شما همچنین می­ توانید تنظیم کنید که چه تعداد خوشه باید توسط الگوریتم شما شناسایی شود. این کار به شما اجازه می ­دهد تا دانه ­دانه و مجزا بودن این گروه­ ها را تنظیم کنید.

خوشه بندی بی نظارت

پیوستگی

قوانین پیوستگی به شما اجازه می ­دهند تا پیوستگی و وابستگی­ هایی بین داده های موجود در پایگاه داده ­های بزرگ، مستقر کنید. این تکنیک بدون نظارت، به دنبال کشف روابطی بین متغیرها در پایگاه داده ­های بزرگ است. برای مثال، افرادی که یک خانه ­ی جدید می­خرند، به احتمال زیاد، لوازم خانگی جدید نیز، خواهند خرید.

سایر مثال­ها:

  • یک زیرگروه از بیماران سرطانی که به وسیله­ ی اندازه ­گیری حالت ژن، گروه ­بندی شده­ اند.
  • گروه­ هایی از خریداران بر اساس تاریخچه ­ی جستجو و خرید آن‌ها
  • گروه فیلم ­ها بر اساس امتیازی که بینندگان داده ­اند.

در زیر دسته بندی های مذکور مربوط به یادگیری ماشین (Machine Learning) را مشاهده می کنید.

خلاصه:

  • در یادگیری تحت نظارت، شما ماشین را با استفاده از داده هایی که به خوبی برچسب گذاری شده اند، آموزش می دهید.
  • یادگیری بدون نظارت یک تکنیک یادگیری ماشین است که در آن نیازی به نظارت بر مدل ندارید.
  • یادگیری تحت نظارت به شما امکان می دهد داده ها را از تجربیات قبلی جمع آوری یا تولید کنید.
  • یادگیری ماشین بدون نظارت به شما کمک می کند تا انواع الگوهای ناشناخته را در داده ها پیدا کنید.
  • رگرسیون و طبقه بندی دو نوع از تکنیک های تحت نظارت در یادگیری ماشین هستند.
  • خوشه بندی و پیوستگی دو نوع یادگیری بدون نظارت هستند.
  • در یک مدل یادگیری تحت نظارت، متغیرهای ورودی و خروجی داده می شود در حالی که با مدل یادگیری بدون نظارت، فقط داده های ورودی داده می شود

 

منبع: guru99

 

همچنین بخوانید: مقاله: منطق فازی به زبانی ساده

بازدید مطلب:۱۶بار