برنامه نویسی به کمک الگوریتم یادگیری تقویتی

تاریخ : 12 تیر, 1393 توسط مدیریت

برنامه نویسی به کمک الگوریتم یادگیری تقویتی
در مساله یادگیری تقویتی به عامل این امکان داده‌می‌شود که ضمن تعامل با محیط و کسب تجربه، با گسترش اعمالی که منجر به پیامد مطلوب می‌شود و محدود کردن اعمالی که منجر به پیامد نامطلوب می‌گردد، به استراتژی و سیاست بهینه برای رسیدن به هدف دست یابد.این کار ، در واقع یافتن نگاشتی از فضای حالت ها به فضای اعمال ممکن در هر حالت است ، که این نگاشت بهترین عمل را در هر حالت به دست می دهد. یادگیری وقتی اتفاق می افتد که عامل با توجه تجارب جدیدی که به دست می آورد ، به طور متفاوتی عمل کند و غالبا عملکرد متفاوت ، منجرو به عملکرد بهتر نیز بشود.این چنین شیوه یادگیری ، کاملا وابسته به فیدبکی است که از طرف محیط اطراف یا سایر عوامل برگردانده می شود.

دیدگاهتان را بنویسید لغو پاسخ