20230911_海通证券_金融工程专题_冯佳睿 袁林青_选股因子系列研究(八十八)——多颗粒度特征的深度学习模型:探索和对比(1)
海通证券·2023-09-11 00:01

量化因子与构建方式 1. 单颗粒度模型 - 因子名称: 单颗粒度模型 - 因子构建思路: 使用不同频率的量价数据构建日度和小时级特征,作为深度学习模型的输入[11] - 因子的公式: 无 - 文章对因子的评价: 使用单一的日度特征已经可以实现不俗的业绩,但更细颗粒度的特征依然有值得挖掘的有效信息[15] 2. 多颗粒度模型 - 因子名称: 多颗粒度模型 - 因子构建思路: 1. "多颗粒度输入,一次性训练":将不同颗粒度的特征均作为模型输入,并通过独立的GRU提取序列信息;随后,将GRU的输出结果合并,再通过MLP得到最终的输出[16] 2. "单颗粒度训练,输出集成":单独训练每一个颗粒度的特征,输出对标签的预测;在最终的推理阶段,集成不同颗粒度模型的输出[16] - 因子的公式: 无 - 文章对因子的评价: 多颗粒度模型的Rank IC和年化多头超额收益,相比单颗粒度模型都得到了不同程度的提升[18] 3. 双向AGRU多颗粒度模型 - 因子名称: 双向AGRU多颗粒度模型 - 因子构建思路: 引入注意力机制,并将GRU模型从单向改为双向,即分别按顺序和逆序学习特征序列,并提取信息[22] - 因子的公式: 无 - 文章对因子的评价: 双向AGRU多颗粒度模型的Rank IC、ICIR和多头超额收益都得到了全面而稳定的提升[26] 4. 多颗粒度残差学习网络 - 因子名称: 多颗粒度残差学习网络 - 因子构建思路: 将多个相同的模块叠加,形成整体网络架构,但每个模块只单独处理一个颗粒度的数据。从第二个模块起,输入的特征都需通过取残差的方式,剔除前一颗粒度已包含的信息[39] - 因子的公式: L=i=1Nyiy^i2+λ1i=1NLRec+λθ2θF2 \mathcal{L}=\sum_{i=1}^{N}||y^{i}-\hat{y}^{i}||^{2}+\lambda_{1}\sum_{i=1}^{N}\mathcal{L}_{Rec}+\frac{\lambda_{\theta}}{2}||\theta||_{F}^{2} - 文章对因子的评价: 多颗粒度残差学习网络并未展现出显著的优势,Rank IC、ICIR、多头组合超额收益均弱于输出集成模型[42] 因子的回测效果 1. 单颗粒度模型 - 5日标签 - Rank IC: 日度 0.118, 60分钟 0.116, 30分钟 0.119[12] - ICIR: 日度 7.54, 60分钟 7.35, 30分钟 7.56[12] - 胜率: 日度 87%, 60分钟 86%, 30分钟 87%[12] - Top10%费前: 日度 30.3%, 60分钟 27.1%, 30分钟 28.7%[12] - 组合年化超额费后: 日度 20.1%, 60分钟 16.8%, 30分钟 18.4%[12] - Top100费前: 日度 37.2%, 60分钟 31.9%, 30分钟 31.9%[12] - 组合年化超额费后: 日度 24.4%, 60分钟 18.6%, 30分钟 18.6%[12] 2. 多颗粒度模型 - 5日标签 - Rank IC: 混合输入 0.139, 输出集成 0.139, 输出集成1 0.139[18] - ICIR: 混合输入 7.83, 输出集成 7.63, 输出集成1 7.71[29] - 胜率: 混合输入 88%, 输出集成 87%, 输出集成1 87%[29] - Top10%费前: 混合输入 30.8%, 输出集成 30.6%, 输出集成1 31.4%[29] - 组合年化超额费后: 混合输入 20.0%, 输出集成 20.6%, 输出集成1 21.4%[29] - Top100费前: 混合输入 37.1%, 输出集成 36.6%, 输出集成1 38.1%[29] - 组合年化超额费后: 混合输入 23.5%, 输出集成 23.8%, 输出集成1 25.3%[29] 3. 双向AGRU多颗粒度模型 - 5日标签 - Rank IC: 混合输入 0.125, 输出集成 0.126, 输出集成1 0.127[29] - ICIR: 混合输入 8.09, 输出集成 7.87, 输出集成1 7.88[29] - 胜率: 混合输入 88%, 输出集成 88%, 输出集成1 88%[29] - Top10%费前: 混合输入 34.5%, 输出集成 33.6%, 输出集成1 34.2%[29] - 组合年化超额费后: 混合输入 23.5%, 输出集成 24.0%, 输出集成1 24.3%[29] - Top100费前: 混合输入 41.1%, 输出集成 42.0%, 输出集成1 42.0%[29] - 组合年化超额费后: 混合输入 27.1%, 输出集成 29.3%, 输出集成1 29.2%[29] 4. 多颗粒度残差学习网络 - 5日标签 - Rank IC: 0.114[42] - ICIR: 7.49[42] - 胜率: 86%[42] - Top10%费前: 27.9%[42] - 组合年化超额费后: 18.6%[42] - Top100费前: 32.1%[42] - 组合年化超额费后: 21.1%[42]