量化分析报告:基于强化学习的组合优化在指增策略中的应用
民生证券·2024-06-17 14:22

基于强化学习的组合优化在指增 策略中的应用 叶尔乐 S0100522110002 韵天雨 S0100122120002 2024年06月17日 * 请务必阅读最后一页免费声明 01 什么是强化学习? 02 StockFormer强化 学习交易策略 03 模型实证与分析 04 总结与思考 05 风险提示 C 和田 00 [] 证券研究报告 1 01. 什么是强化学习? □□ 证券研究报告 * 请务必阅读最后一页免费声明 2 01 什么是强化学习? > 1.1 强化学习 · 强化学习是一种机器学习方法,通过与环境的交互来训练智能体,使其在不同状态下采取能够最大化累积奖励的行动。其目标是通 过试错学习 (trial-and-error) 找到最优策略,使得在长时间内累积的奖励最大化。在强化学习中,智能体(Agent)通过与环境的 互动不断学习,通过奖励和惩罚来调整其策略,以便在长期内获得最大回报。 · 在强化学习中,数据是在智能体与环境交互的过程中得到的。如果智能体不采取某个决策动作,那么该动作对应的数据就永远无法 被观测到,所以当前智能体的训练数据来自之前智能体的决策结果。因此,智能体的策略不同,与环境交互所产生 ...