یادگیری تقویتی : یک مرور ویژه و کارهای پیشرو + همراه با شبیه سازی مقاله

کنترل حساس هدف در مسائل مارکوف و نیمه مارکوف + سورس مقاله