دفاعیه کارشناسی ارشد (برق و کامپیوتر) بررسی رمزگذارها برای افزایش میزان سود و کاهش حد ضرر معاملات با استفاده از الگوریتم بهینه‌سازی سیاست (PPO)

 | تاریخ ارسال: 1400/12/18 | 
دانشجو: آقای میثم خیرالله نژاد
استاد راهنما: دکتر میرمحسن پدرام
زمان: چهارشنبه شنبه ۲۵ اسفند ماه ۱۴۰۰ ساعت: ۱۰:۰۰

لینک ورود به جلسه
چکیده:
معاملات خودکار سهام نقش مهمی در سرمایه‌گذاری دارد. بااین‌حال، طراحی یک مدل سودآور به دلیل پویایی و پیچیدگی ماهیت بازار سهام امر بسیار چالش‌برانگیزی است. همچنین با توجه به وجود عوامل تأثیرگذار بسیار زیاد در بازار سهام پیدا کردن استراتژی مناسب برای معامله‌گر بسیار کار طاقت‌فرسا و خسته‌کننده‌ای است. اضافه کردن این نکته نیز بسیار ضروری است که در بازارهای مالی مانند ارزهای مجازی به‌صورت ۲۴ ساعته فعال هستند و این نکته نیز از نکات بسیار مهم برای پیاده‌سازی عاملی خودکار برای انجام معاملات است که قابلیت در نظر گرفتن تمام شاخص‌ها و همچنین کارایی ۲۴ ساعته داشته باشد.در این پژوهش هدف پیاده‌سازی عاملی است که بتواند به‌صورت خودکار و با استفاده از الگوریتم‌های تقویتی در بازار رمز ارزها به معامله بپردازد.
لازم به ذکر است نوآوری‌های این پژوهش شامل استفاده از استراتژی ابر کومو و همچنین داده‌ی با ابعاد بسیار بالا است که در پژوهش‌های پیشین در این حوزه هرگز موردبررسی قرار نگرفته است. همچنین برای نوآوری دوم نیز تابع سود عامل با استفاده از ویژگی‌های مختلفی مانند میزان سوددهی ، میزان اتمام پول عامل و همچنین میزان ضرر معاملات عامل طراحی‌شده است. در این پژوهش ما ابتدا با جمع‌آوری داده‌ی مربوط به بازارهای مالی و به‌طور نمونه بیت کوین شروع کردیم. این کار با استفاده از خزنده‌های وب انجام شد. در مرحله‌ی بعد این داده با استفاده از یک تابع پیش‌پردازش ویژگی‌های موردنیاز که حدود ۴۰ ویژگی هستند را به مجموعه داده در هر دو حالت اضافه شدند. پس از اضافه شدن این ویژگی‌ها تمام آن‌ها به‌جز ویژگی‌های مربوط به قیمت سهام نرمال‌سازی شده و ورودی یک خود رمزگذار قرارگرفته‌اند. وظیفه‌ی این خود رمزگذار کاهش ابعاد این مجموعه داده برای کوچک‌تر کردن فضای اکتشاف عامل است. این کاهش ابعاد از ۴۰ ویژگی به ۹ ویژگی انجام پذیرفت. در انتها نیز با طراحی محیط عامل و استفاده از الگوریتم‌های یادگیری تقویتی مدل خود را آموزش دادیم.نتایج به‌دست‌آمده نشان‌دهنده روند یادگیری بهینه‌ای توسط عامل است.
 
کلمات کلیدی:                                                      
یادگیری تقویتی ، ابرکومو ، معاملات رمز ارز ، عامل مبتنی بر سیاست



CAPTCHA

دفعات مشاهده: 147 بار   |   دفعات چاپ: 16 بار   |   دفعات ارسال به دیگران: 0 بار   |   0 نظر