2025-09-03
分享到
《基于量价与基本面结合的深度学习选股策略》由信达证券发布,主要探讨了深度学习理论在选股中的应用,包括神经元与激活函数、前馈神经网络、反向传播算法、学习率调整算法Adam、丢弃法(Dropout)等内容,通过对比Lasso和MLP在量价与基本面因子上的表现,以及对量价与基本面因子结合的初步尝试,得出了一些有意义的结论。
- 神经元与激活函数:神经元是神经网络的基本单元,净输入经过激活函数后得到神经元的输出。常用的激活函数有Sigmoid型函数(如Logistic函数、Tanh函数)和ReLU函数。
- 前馈神九游体育官方网站经网络拟合能力较强:前馈神经网络的目标是近似某个函数,通过中间函数计算最终输出,其训练过程促使函数匹配真实标签的值。
- 前馈神经网络的反向传播算法:代价函数用于量化模型预测和真实标签之间的差异,反向传播算法根据代价函数信息通过网络向后流动以计算代价函数关于参数的梯度。
- 学习率调整算法Adam:Adam是一种学习率自适应的优化算法,由动量梯度下降法和RMSprop算法结合而成,可以加速收敛并自适应调节学习率。
- 丢弃法(Dropout):Dropout层是一种在神经网络中常用的正则化技术,用于防止模型过拟合,在训练过程中随机“丢弃”一部分神经元。
- 量价因子数据集:采用Alpha158量价因子,包含日内、波动、价、量、量价相关性等5类共158个因子。
- 基本面因子数据集:加入38个基本面因子,包含估九游体育官方网站值、质量、成长和分析师一致预期等维度。
- 数据预处理与网络参数设置:对特征和标签进行处理,设置神经网络参数和全A选股组合回测参数与方式。
- Lasso Vs MLP -- 量价因子:非线性的全连接神经网络相较于线性模型Lasso,在量价因子上展现出更出色的预测能力,RankIC更高,费后的多头超额收益和多空超额收益也更高。
- Lasso Vs MLP -- 基本面因子:MLP相较于Lasso在基本面因子上的提升幅度不如在量价因子上明显,两个模型的差距不显著。
- 全连接网络隐藏层神经元数量设置的敏感性分析与启示:通过对一层与两层的全连接神经网络的神经单元数量进行遍历,发现全连接神经网络相较于Lasso模型的优势较稳定,且自身的参数敏感性在可接受范围内。
- 小结:非线性模型更能挖掘量价因子的潜力,可能是因为基本面因子结合的逻辑偏线性,部分基本面因子在财报真空期值不变,且基本面因子数量相对较少。
- 线性方式 -- 等权结合:等权因子的RankIC、年化多头超额和年化多空超额均低于原始量价合成因子。
- 线性方式 -- ICIR加权:ICIR加权因子的RankIC与纯量价因子基本持平,多头超额收益略高于纯量价因子,但多空超额收益低于纯量价因子。
- 非线性方式 -- 输入层拼接量价与基本面:输入层拼接因子的RankIC均值、多头超额收益和多空超额收益均有所提升,波动与回撤均有下降。
- 非线性方式 -- 分支网络统筹子因子合成与大类因子加权:分支网络合成因子在IC、ICIR、多头超额收益与多空超额收益等方面优于其他合成形式,最大回撤也有一定改善。
- 方法:以20日因子为底仓,每20个交易日根据20日合成因子构建底仓;每5个交易日根据5日合成因子选择排名前25% / 50% / 75%的股票;将两个股票集合取交集,形成混频投资组合。
- 结果:混频组合相较于原始的20日组合有较稳定的超额收益,与前25%的5日因子取交集,多头超额提升6.98pct,与前50%取交集提升4.79pct,与前75%取交集提升3.