برنامه نویسی به کمک الگوریتم یادگیری تقویتی

برنامه نویسی به کمک الگوریتم یادگیری تقویتی
     در مساله یادگیری تقویتی به عامل این امکان داده‌می‌شود که ضمن تعامل با محیط و کسب تجربه، با گسترش اعمالی که منجر به پیامد مطلوب می‌شود و محدود کردن اعمالی که منجر به پیامد نامطلوب می‌گردد، به استراتژی و سیاست بهینه برای رسیدن به هدف دست یابد.این کار ، در واقع یافتن نگاشتی از فضای حالت ها به فضای اعمال ممکن در هر حالت است ، که این نگاشت بهترین عمل را در هر حالت به دست می دهد. یادگیری وقتی اتفاق می افتد که عامل با توجه تجارب جدیدی که به دست می آورد ، به طور متفاوتی عمل کند و غالبا عملکرد متفاوت ، منجرو به عملکرد بهتر نیز بشود.این چنین شیوه یادگیری ، کاملا وابسته به فیدبکی است که از طرف محیط اطراف یا سایر عوامل برگردانده می شود.

برچسب ها

0 دیدگاه در “برنامه نویسی به کمک الگوریتم یادگیری تقویتی”

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *

کتاب

کتاب جامع دستورات متلب - خرید پستی درب منزل این کتاب شامل تمامی دستورات عمومی متلب می باشد
خرید اینترنتی
web hit counter