发布时间:2025-11-06
机器学习方法在近期的资产定价文献中获得了广泛关注,现有文献充分证明了机器学习模型在预测股票横截面收益方面优于传统模型,能够显著提升投资业绩。然而,现有研究普遍使用已发表的异象变量作为股票收益的预测因子,并隐含假设这些变量在训练期间对于投资者是已知的。
这种方法适用于事后衡量风险溢价或估计随机折现因子,但忽视了投资者能否实时从大量信号池中筛选出有效信号的关键问题。因此,对于实时投资者而言,已有研究中记录的使用机器学习预测所产生的经济收益可能被高估。
为了进一步解决机器学习方法对实时投资者是否有益的问题,中国人民大学商学院财务与金融系郑凌凌教授与其合作者撰写了论文“Machine learning from a ‘‘Universe’’ of signals: The role of feature engineering”,并发表于金融学领域顶级期刊Journal of Financial Economics。
该论文基于一个包含超过18,000个基本面信号的“宇宙”(universe)构建实时机器学习策略:使用基于机器学习预测的收益构建多空投资组合,买入预测收益最高的股票,并卖空预测收益最低的股票。这些信号可供投资者实时获取,而非学术期刊上发表的精选子集。使用的主要机器学习方法是梯度提升回归树(Boosted Regression Trees),并使用神经网络(Neural Network)作为补充。
该研究发现,实时机器学习策略的样本外性能虽然具有经济和统计上的显著性,但其收益和夏普比率显著低于过往研究中使用精选信号集作为预测因子的结果,差距源于输入预测因子的选择。同时,基于每个信号的历史表现构建纳入特征工程的简单递归排序策略,也产生了显著更优的样本外性能,表明对机器学习算法施加适当结构或“归纳偏好”(Inductive Bias)在横截面预测任务中至关重要。对历史收益信号的分析也得出了与基于基本面信号的分析相似的结论。该研究强调了特征工程以及更广义的归纳偏好对提升机器学习投资策略经济收益方面的关键作用。
已发表文章: