بهینه سازی سبدسهام با استفاده از یادگیری تقویتی عمیق و مبتنی بر نظریه مدرن پرتفوی
کلمات کلیدی:
الگوریتم لونبرگ- ماد, بهینه سازی سبد سهام, نظریه مدرن پرتفوی و یادگیری تقویتی عمیقچکیده
این پژوهش به بررسی استفاده از یادگیری تقویتی عمیق در بهینهسازی سبد سرمایهگذاری میپردازد و به ادغام آن با تئوری مدرن سبد سرمایهگذاری پرداخته و تحولاتی را در استراتژیهای مدیریت مالی نشان میدهد. در حالی که تئوری مدرن سبد سرمایهگذاری به عنوان یک چارچوب ریاضی برای حداکثرسازی بازده مورد انتظار با در نظر گرفتن ریسک شناخته میشود، نواقص آن، نظیر فرضیات مربوط به توزیع نرمال بازدهها و غفلت از هزینههای معاملاتی، نیاز به راهحلهای انطباقپذیر را در بازارهای مالی پیچیده و پویا به وضوح نمایان میسازد. این پژوهش نشان میدهد که با بکارگیری یادگیری تقویتی عمیق، سرمایهگذاران قادر خواهند بود تا با بهرهبرداری از دادههای لحظهای و تواناییهای تصمیمگیری پویا، استراتژیهای سرمایهگذاری کارآمدتر و قدرتمندتری را توسعه دهند. همچنین، چالشهایی نظیر کیفیت داده، پیچیدگی محاسباتی و قابلیت تفسیر مدلهای یادگیری تقویتی عمیق به صورت عمیق مورد بحث قرار گرفته است. در این پژوهش، یک مدل شبکه عصبی الگوریتم لونبرگ- ماد یادگیری تقویتی عمیق، برای بهینه سازی سبد سهام بر اساس دادههای تاریخی پیشنهاد شدهاست. بـدین منظـور، از دادههای 10 شركت پذیرفته شده در بورس اوراق بهادار تهران كه دارای نقدینگی بالا در بازة زمانی 1390 تا 1400 بودند، استفاده شده است. نتایج بهدستآمده از این مطالعه نشان میدهد که الگوریتمهای یادگیری تقویتی عمیق در انتخاب پورتفوی میتواند به افزایش ۱۵ درصدی بازده تجمعی در مقایسه با روشهای سنتی منجر شود. علاوه بر این، این مقاله به تحلیلگران و سرمایهگذاران توصیه میکند که از تکنیکهای پیشرفتهای برای بهبود پایداری عملکرد شرکتها استفاده کنند تا بتوانند تصمیمات بهتری در زمینه سرمایهگذاری اتخاذ نمایند. در نهایت، این تحقیق راهکارهایی برای پژوهشهای آینده در این زمینه ارائه میدهد.
دانلودها
مراجع
Almahdi, S., & Yang, S. Y. (2017). An adaptive portfolio trading system: A risk-return portfolio optimization using recurrent reinforcement learning with expected maximum drawdown. Neurocomputing, 207, 279-290. https://doi.org/10.1016/j.neucom.2016.05.005
Ayari Salah, G. H. (2025). A meta-analysis of supervised and unsupervised machine learning algorithms and their application to active portfolio management. Expert Systems with Applications, 271, 126611. https://doi.org/10.1016/j.eswa.2025.126611
Benhamou, E., Saltiel, D., Ungari, S., & Mukhopadhyay, A. (2020). Bridging the gap between Markowitz planning and deep reinforcement learning. https://doi.org/10.2139/ssrn.3702112
Chaher, A. (2025). Optimizing portfolio selection through stock ranking and matching: A reinforcement learning approach. Expert Systems with Applications, 269, 126430. https://doi.org/10.1016/j.eswa.2025.126430
Chaouki, A., Hardiman, S., Schmidt, C., Sérié, E., & De Lataillade, J. (2020). Deep deterministic portfolio optimization. The Journal of Finance and Data Science, 6, 16-30. https://doi.org/10.1016/j.jfds.2020.06.002
Cong, L. W., Tang, K., Wang, J., & Zhang, Y. (2021). AlphaPortfolio: Direct construction through deep reinforcement learning and interpretable AI. Available at SSRN, 3554486
Deng, Y., Bao, F., Kong, Y., Ren, Z., & Dai, Q. (2016). Deep direct reinforcement learning for financial signal representation and trading. IEEE Transactions on Neural Networks and Learning Systems, 28(3), 653-664. https://doi.org/10.1109/TNNLS.2016.2522401
Goodell, J. W., Kumar, S., Lim, W. M., & Pattnaik, D. (2021). Artificial intelligence and machine learning in finance: Identifying foundations, themes, and research clusters from bibliometric analysis. Journal of Behavioral and Experimental Finance, 32, 100577. https://doi.org/10.1016/j.jbef.2021.100577
Henriques, I., & Sadorsky, P. (2023). Forecasting NFT coin prices using machine learning: Insights into feature significance and portfolio strategies. Global Finance Journal, 58, 100904. https://doi.org/10.1016/j.gfj.2023.100904
Heydari, M. S., Validi, J., & Ebrahimi, S. B. (2021). Portfolio Optimization Based on a Robust Possibilistic Programming Model Using Genetic Algorithms and Mixed Frog Leaping Algorithm. Financial Engineering and Securities Management, 12(47).
Jiang, Z., Xu, D., & Liang, J. (2017). A deep reinforcement learning framework for the financial portfolio management problem. arXiv preprint arXiv:1706. 10059
Jyotirmayee Behera, P. K. (2025). An approach to portfolio optimization with time series forecasting algorithms and machine learning techniques. Applied Soft Computing, 170, 112741. https://doi.org/10.1016/j.asoc.2025.112741
Koratamaddi, P., Wadhwani, K., Gupta, M., & Sanjeevi, S. G. (2021). Market sentiment-aware deep reinforcement learning approach for stock portfolio allocation. Engineering Science and Technology, an International Journal, 24(4), 848-859. https://doi.org/10.1016/j.jestch.2021.01.007
Liang, Z., Chen, H., Zhu, J., Jiang, K., & Li, Y. (2018). Adversarial deep reinforcement learning in portfolio management. arXiv preprint arXiv:1808. 09940
Lima Paiva, F. C., Felizardo, L. K., Bianchi, R. A. d. C., & Costa, A. H. R. (2021). Intelligent trading systems: a sentiment-aware reinforcement learning approach. https://doi.org/10.1145/3490354.3494445
Liu, X. Y., Yang, H., Chen, Q., Zhang, R., Yang, L., Xiao, B., & Wang, C. D. (2020). FinRL: A deep reinforcement learning library for automated stock trading in quantitative finance. https://doi.org/10.2139/ssrn.3737257
Mnih, V., Kavukcuoglu, K., Silver, D., Rusu, A. A., Veness, J., & Bellemare, M. G. (2015). Human-level control through deep reinforcement learning. Nature, 518(7540), 529-533. https://doi.org/10.1038/nature14236
Mohammadi Baghmalaei, H., Parsa, H., Tahmasebi, S., & Hajiani, P. (2021). Application of Cumulative Entropy Criterion and PSO Algorithm in Portfolio Optimization of Petrochemical Companies in Tehran Stock Exchange. Biannual Journal of Development and Investment, 6(2).
Moshrefi, M., & Behnamian, J. (2022). Multi-Objective Portfolio Optimization Using Hierarchical Analysis and Genetic Algorithm. Biannual Journal of Engineering Management and Soft Computing, 7(1).
Mostafaei Darmian, S., & Doaei, M. (2021). A Stochastic Optimization-Based Approach for Solving the Portfolio Selection Problem in Iran's Capital Market Using Metaheuristic Algorithms. Quarterly Journal of Applied Economic Theories, 8(4).
Sun, S., Wang, R., He, X., Zhu, J., Li, J., & An, B. (2021). Deepscalper: A risk-aware deep reinforcement learning framework for intraday trading with micro-level market embedding. arXiv preprint arXiv:2201. 09058
Sutton, R. S., & Barto, A. G. P. (2018). Reinforcement learning: An introduction. MIT Press.
Yifu, J., Jose, O., & Majed, A. (2024). Deep reinforcement learning for portfolio selection. Global Finance Journal, 62, 101016. https://doi.org/10.1016/j.gfj.2024.101016
دانلود
چاپ شده
ارسال
بازنگری
پذیرش
شماره
نوع مقاله
مجوز
حق نشر 2025 Yaser Rezaei Piteh Novi, Mehdi Safari Graili, Mohammad Taghi Kabiri, Meysam Arabzadeh (Author)

این پروژه تحت مجوز بین المللی Creative Commons Attribution-NonCommercial 4.0 می باشد.