مدل ابتکاری نقاد تطبیقی نیمه مارکوف برای مدیریت درآمد شرکت هواپیمایی

پروژه ۱۲۰۶: شبیه سازی مقاله در متلب + حل دقیق و کامل در متلب مطابق با مقاله

خلاصه: 

     مدل ابتکاری نقاد تطبیقی نیمه مارکوف به عنوان یک الگوریتم محبوب در یادگیری تقویتی و همینطور در برنامه ریزی پویا به شمار می رود. آن یکی از ابتدایی ترین الگوریتم های یادگیری تقویتی و پویا می باشد. الگوریتم های یادگیری تقویتی و پویا به طور ویژه برای حل مسئله تصمیم گیری مارکوف مفید بوده است. چندین مسئله واقعی در پروسه تصمیم گیری نیمه مارکوف به کار رفته است. متاسفانه برای هر پاداش متوسط، تصمیم گیری مارکوف نمی تواند به آسانی نیمه مارکوف عمل نماید. مثال های نیمه مارکوف در حوزه های مدیریت سلسله ، مدیریت نگهداری و مدیریت درآمد شرکت هواپیمایی می تواند به کار رود. در این مقاله مدل ابتکاری نقاد تطبیقی برای مسئله نیمه مارکوف تحت پاداش متوسط به صورت طولانی مدت پیشنهاد شده است. ما تحلیل همگرایی الگوریتم را تحت شرایط خاص پیشنهاد داده ایم. همگرایی الگوریتم با یک راه حل بهینه با احتمال ۱ پیشنهاد شده است. ما الگوریتم را روی مسئله مدیریت درآمد شرکت هواپیمایی با تنظیم قیمت ها برای بلیط هواپیما انجام داده ایم. مسئله دارای ابعاد بالاست، نفرین ابعاد نیز وجود دارد لذا از اینرو حل بوسیلهروش های پویای کلاسیک مشکل می باشد. نتایج عددی ما نشان می دهد که الگوریتم به نتایج مناسبی در صنعت هواپیمایی رسیده است.  برای توضیحات بیشتر ، مقاله را از لینک زیر دانلود نمایید. 

دانلود: دانلود اصل مقاله لاتین

در صورت سوال در مورد محصول می توانید از بخش تماس با ما (منوی بالا)، با شماره تلفن مورد نظر مکاتبه نمایید.

پس از پرداخت آنلاین فایل قابل دانلود می باشد. 

خرید آنلاین

 

برخی نتایج:

p1206-1 p1206-2

iter =

۷۳

phi_final =

۱٫۹۵۱۸

policy =

۲ ۱

value_function =

-۰٫۰۱۹۲ ۵٫۴۰۳۴

state =

۱

action =

۱

ans =

-۴٫۴۳۱۷

state =

۱

action =

۲

ans =

-۰٫۰۱۹۲

state =

۲

action =

۱

ans =

۵٫۴۰۳۴

state =

۲

action =

۲

ans =

-۱٫۷۰۱۷

 


مجموعه: یادگیری تقویتیبرچسب ها , , , , , , , , , , , , , , , , , , , , , , ,

دیدگاهتان را بنویسید

نشانی ایمیل شما منتشر نخواهد شد. بخش‌های موردنیاز علامت‌گذاری شده‌اند *