今年3 月,我们团队发布了一个胜率接近80%的模型,从发布至今得到广泛关注,上半年的波段中,除了5 月由于换券等因素导致模型短期失效,其余区间胜率100%。但与此同时,也收到了很多投资者的建议,例如模型灵敏性、因子多样性、胜率的提升空间等,因此我们进行进一步优化尝试,得到了一套更准确的利率择时模型。
改进后的模型有哪些优点?第一,模型的胜率更高。模型预测方向正确天数总和684 天,错误天数34 天,胜率95.26%,累计收益177.45bp。从2021 年6 月30 日至2025 年7 月11 日,仅考虑资本利得的情况下,策略净值为1.16,样本外测试集区间,策略净值为1.11。2023 年3 月至今形成择时区间21 个,其中方向正确18 个,方向错误3 个,区间胜率85.71%。正确区间平均长度38 天,错误区间平均长度11.33 天,模型的正确率和纠错能力均有所提升。
第二,回撤控制更好。模型正确区间内的最大回撤为8.29bp,全样本区间最大回撤8.32bp,较初代模型表现有所提升。
第三,模型的左侧效果较好。我们依旧使用5 日移动平均结果作为择时信号,可以提前5-10 天捕捉到利率的多空转换。
第四,模型结果依旧稳健,较少出现反复。尤其5 日移动平均结果极少出现与波段方向背离的现象。
第五,模型的震荡区间控制较好,绝大多数时刻可以发出明确择时信号,仅有10.6%的预测结果发出40%-60%区间的震荡信号。
模型做了哪些优化?首先我们丰富了因子集。我们从前期模型的231 个宏观和微观中高频经济变量扩充至278 个,同时加入技术因子、机构行为因子以及情绪因子,新增150 个备选因子,共计428 个因子。
其次优化了因子选取方式。我们使用SHAP 来进行因子筛选,计算每个窗口因子的SHAP 值,来提取平均贡献较大的因子。进一步,我们使用二分法逐步训练测试,选取效果相对较好的因子数量,最终我们选取151 个因子。
最后对算法应用及模型训练进行优化。第一,底层模型使用两层循环的神经网络;第二,应用L2 正则化、Dropout 等规避过拟合问题;第三,在结果输出阶段,我们不再以20 个交易日为重置窗口,而是每个交易日重新训练后输出结果,保证结果的灵敏性和及时性。
风险提示:模型失效风险;因子失效风险;数据质量风险