سورس مقاله: الگوهای تعاملی مارکوف درمورد الگوریتمهای تکاملی

مدل ابتکاری نقاد تطبیقی نیمه مارکوف برای مدیریت درآمد شرکت هواپیمایی

بازی باکارات (شبیه سازی متلب + توضیحات کامل وورد)

مقدمه ای بر یادگیری تقویتی نوشته ریچارد ساتن و اندرو بارتو

برنامه نویسی به کمک الگوریتم یادگیری تقویتی