بهینه سازی سبدسهام با استفاده از یادگیری تقویتی عمیق و مبتنی بر نظریه مدرن پرتفوی

نویسندگان

    یاسر رضائی پیته نوئی گروه حسابداری، واحد کاشان، دانشگاه آزاد اسلامی، کاشان، ایران.
    مهدی صفری گرایلی * گروه حسابداری، واحد بندرگز، دانشگاه آزاد اسلامی، بندرگز، ایران. safari83@iau.ac.ir
    محمدتقی کبیری گروه حسابداری، واحد اراک، دانشگاه آزاد اسلامی، اراک، ایران.
    میثم عرب زاده گروه حسابداری، واحد رشت، دانشگاه آزاد اسلامی، رشت، ایران.

کلمات کلیدی:

الگوریتم لونبرگ- ماد, بهینه سازی سبد سهام, نظریه مدرن پرتفوی و یادگیری تقویتی عمیق

چکیده

این پژوهش به بررسی استفاده از یادگیری تقویتی عمیق در بهینه‌سازی سبد سرمایه‌گذاری می‌پردازد و به ادغام آن با تئوری مدرن سبد سرمایه‌گذاری پرداخته و تحولاتی را در استراتژی‌های مدیریت مالی نشان می‌دهد. در حالی که تئوری مدرن سبد سرمایه‌گذاری به عنوان یک چارچوب ریاضی برای حداکثرسازی بازده مورد انتظار با در نظر گرفتن ریسک شناخته می‌شود، نواقص آن، نظیر فرضیات مربوط به توزیع نرمال بازده‌ها و غفلت از هزینه‌های معاملاتی، نیاز به راه‌حل‌های انطباق‌پذیر را در بازارهای مالی پیچیده و پویا به وضوح نمایان می‌سازد. این پژوهش نشان می‌دهد که با بکارگیری یادگیری تقویتی عمیق، سرمایه‌گذاران قادر خواهند بود تا با بهره‌برداری از داده‌های لحظه‌ای و توانایی‌های تصمیم‌گیری پویا، استراتژی‌های سرمایه‌گذاری کارآمدتر و قدرتمندتری را توسعه دهند. همچنین، چالش‌هایی نظیر کیفیت داده، پیچیدگی محاسباتی و قابلیت تفسیر مدل‌های یادگیری تقویتی عمیق به صورت عمیق مورد بحث قرار گرفته است. در این پژوهش، یک مدل شبکه عصبی الگوریتم لونبرگ- ماد یادگیری تقویتی عمیق، برای بهینه سازی سبد سهام بر اساس داده‌های تاریخی پیشنهاد شده‌است. بـدین منظـور، از داده‌های 10 شركت پذیرفته شده در بورس اوراق بهادار تهران كه دارای نقدینگی بالا در بازة زمانی 1390 تا 1400 بودند، استفاده شده است. نتایج به‌دست‌آمده از این مطالعه نشان می‌دهد که الگوریتم‌های یادگیری تقویتی عمیق در انتخاب پورتفوی می‌تواند به افزایش ۱۵ درصدی بازده تجمعی در مقایسه با روش‌های سنتی منجر شود. علاوه بر این، این مقاله به تحلیل‌گران و سرمایه‌گذاران توصیه می‌کند که از تکنیک‌های پیشرفته‌ای برای بهبود پایداری عملکرد شرکت‌ها استفاده کنند تا بتوانند تصمیمات بهتری در زمینه سرمایه‌گذاری اتخاذ نمایند. در نهایت، این تحقیق راهکارهایی برای پژوهش‌های آینده در این زمینه ارائه می‌دهد.

 

دانلودها

دسترسی به دانلود اطلاعات مقدور نیست.

مراجع

Almahdi, S., & Yang, S. Y. (2017). An adaptive portfolio trading system: A risk-return portfolio optimization using recurrent reinforcement learning with expected maximum drawdown. Neurocomputing, 207, 279-290. https://doi.org/10.1016/j.neucom.2016.05.005

Ayari Salah, G. H. (2025). A meta-analysis of supervised and unsupervised machine learning algorithms and their application to active portfolio management. Expert Systems with Applications, 271, 126611. https://doi.org/10.1016/j.eswa.2025.126611

Benhamou, E., Saltiel, D., Ungari, S., & Mukhopadhyay, A. (2020). Bridging the gap between Markowitz planning and deep reinforcement learning. https://doi.org/10.2139/ssrn.3702112

Chaher, A. (2025). Optimizing portfolio selection through stock ranking and matching: A reinforcement learning approach. Expert Systems with Applications, 269, 126430. https://doi.org/10.1016/j.eswa.2025.126430

Chaouki, A., Hardiman, S., Schmidt, C., Sérié, E., & De Lataillade, J. (2020). Deep deterministic portfolio optimization. The Journal of Finance and Data Science, 6, 16-30. https://doi.org/10.1016/j.jfds.2020.06.002

Cong, L. W., Tang, K., Wang, J., & Zhang, Y. (2021). AlphaPortfolio: Direct construction through deep reinforcement learning and interpretable AI. Available at SSRN, 3554486

Deng, Y., Bao, F., Kong, Y., Ren, Z., & Dai, Q. (2016). Deep direct reinforcement learning for financial signal representation and trading. IEEE Transactions on Neural Networks and Learning Systems, 28(3), 653-664. https://doi.org/10.1109/TNNLS.2016.2522401

Goodell, J. W., Kumar, S., Lim, W. M., & Pattnaik, D. (2021). Artificial intelligence and machine learning in finance: Identifying foundations, themes, and research clusters from bibliometric analysis. Journal of Behavioral and Experimental Finance, 32, 100577. https://doi.org/10.1016/j.jbef.2021.100577

Henriques, I., & Sadorsky, P. (2023). Forecasting NFT coin prices using machine learning: Insights into feature significance and portfolio strategies. Global Finance Journal, 58, 100904. https://doi.org/10.1016/j.gfj.2023.100904

Heydari, M. S., Validi, J., & Ebrahimi, S. B. (2021). Portfolio Optimization Based on a Robust Possibilistic Programming Model Using Genetic Algorithms and Mixed Frog Leaping Algorithm. Financial Engineering and Securities Management, 12(47).

Jiang, Z., Xu, D., & Liang, J. (2017). A deep reinforcement learning framework for the financial portfolio management problem. arXiv preprint arXiv:1706. 10059

Jyotirmayee Behera, P. K. (2025). An approach to portfolio optimization with time series forecasting algorithms and machine learning techniques. Applied Soft Computing, 170, 112741. https://doi.org/10.1016/j.asoc.2025.112741

Koratamaddi, P., Wadhwani, K., Gupta, M., & Sanjeevi, S. G. (2021). Market sentiment-aware deep reinforcement learning approach for stock portfolio allocation. Engineering Science and Technology, an International Journal, 24(4), 848-859. https://doi.org/10.1016/j.jestch.2021.01.007

Liang, Z., Chen, H., Zhu, J., Jiang, K., & Li, Y. (2018). Adversarial deep reinforcement learning in portfolio management. arXiv preprint arXiv:1808. 09940

Lima Paiva, F. C., Felizardo, L. K., Bianchi, R. A. d. C., & Costa, A. H. R. (2021). Intelligent trading systems: a sentiment-aware reinforcement learning approach. https://doi.org/10.1145/3490354.3494445

Liu, X. Y., Yang, H., Chen, Q., Zhang, R., Yang, L., Xiao, B., & Wang, C. D. (2020). FinRL: A deep reinforcement learning library for automated stock trading in quantitative finance. https://doi.org/10.2139/ssrn.3737257

Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., & Bellemare, M. G. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533. https://doi.org/10.1038/nature14236

Mohammadi Baghmalaei, H., Parsa, H., Tahmasebi, S., & Hajiani, P. (2021). Application of Cumulative Entropy Criterion and PSO Algorithm in Portfolio Optimization of Petrochemical Companies in Tehran Stock Exchange. Biannual Journal of Development and Investment, 6(2).

Moshrefi, M., & Behnamian, J. (2022). Multi-Objective Portfolio Optimization Using Hierarchical Analysis and Genetic Algorithm. Biannual Journal of Engineering Management and Soft Computing, 7(1).

Mostafaei Darmian, S., & Doaei, M. (2021). A Stochastic Optimization-Based Approach for Solving the Portfolio Selection Problem in Iran's Capital Market Using Metaheuristic Algorithms. Quarterly Journal of Applied Economic Theories, 8(4).

Sun, S., Wang, R., He, X., Zhu, J., Li, J., & An, B. (2021). Deepscalper: A risk-aware deep reinforcement learning framework for intraday trading with micro-level market embedding. arXiv preprint arXiv:2201. 09058

Sutton, R. S., & Barto, A. G. P. (2018). Reinforcement learning: An introduction. MIT Press.

Yifu, J., Jose, O., & Majed, A. (2024). Deep reinforcement learning for portfolio selection. Global Finance Journal, 62, 101016. https://doi.org/10.1016/j.gfj.2024.101016

دانلود

چاپ شده

۱۴۰۳/۱۱/۲۵

ارسال

۱۴۰۳/۰۹/۰۵

بازنگری

۱۴۰۳/۱۰/۲۸

پذیرش

۱۴۰۳/۱۱/۰۷

شماره

نوع مقاله

Articles

ارجاع به مقاله

رضائی پیته نوئی ی.، صفری گرایلی م.، کبیری م. .، و عرب زاده م. . (1403). بهینه سازی سبدسهام با استفاده از یادگیری تقویتی عمیق و مبتنی بر نظریه مدرن پرتفوی. حسابداری، امور مالی و هوش محاسباتی، 2(4)، 276-293. https://jafci.com/index.php/jafci/article/view/89

مقالات مشابه

1-10 از 64

همچنین برای این مقاله می‌توانید شروع جستجوی پیشرفته مقالات مشابه.