مدل نقاد تطبیقی برای کنترل نیمه مارکوف + شبیه سازی مقاله

مدل های تغییر نقطه ای و مدل های سری زمانی + سورس رایگان متلب

استنتاج بیزی نیمه پارامتریک برای مدل های مرزی تصادفی

کد برنامه پاداش های نزولی با Q-Learning + کد متلب کامل

یادگیری تقویتی برای متوسط هزینه بلند مدت + پروژه کامل متلب

گام های پله، یافتن کوتاه ترین مسیر و احتمال بقا در یادگیری تقویتی

شبیه سازی مقاله : کنترل موثر هدف فرآیند مارکوف و نیمه مارکوف با متلب

بازی باکارات (شبیه سازی متلب + توضیحات کامل وورد)

مقدمه ای بر یادگیری تقویتی نوشته ریچارد ساتن و اندرو بارتو