战法研究报告

基于历史数据的 ML 建模与回测分析,验证各战法的信号质量和盈利潜力

综合对比

战法 信号数 AUC-ROC T+1 最大涨幅 涨幅胜率 评价
暴力K战法 5,484 0.9103 +0.62% +8.48% 89.9% 数据泄漏+特征错位
少妇战法 12,348 0.9946 +0.10% +5.40% 81.9% Lift 10.4x
填坑战法 4,516 0.9951 +0.15% +5.70% 81.2% Lift < 1
补票战法 2,436 0.9966 +0.15% +7.11% 94.4% 回测最强
上穿60放量战法 21,560 0.9948 +0.28% +6.28% 94.1% 模型过拟合

T+1 = 信号后第1天收益均值 | 最大涨幅 = 信号后5-10天内最高收益均值 | Lift = 模型精度/基线精度

💥

暴力K战法

BigBullishVolumeSelector

数据泄漏+特征错位
💎

少妇战法

BBIKDJSelector

Lift 10.4x

填坑战法

PeakKDJSelector

Lift < 1
🎯

补票战法

BBIShortLongSelector

回测最强
📈

上穿60放量战法

MA60CrossVolumeWaveSelector

模型过拟合

跨战法共性发现

1.

ZX Spread 是通用强特征

在少妇、填坑(#2)、补票(#3)、上穿60(#1)中都是核心特征。知行线的短长线差值(ZXDQ-ZXDKX)对信号质量有极强区分力。

2.

所有信号的5日最大涨幅胜率 > 80%

说明这些技术形态选出的股票几乎都有一波拉升,核心问题在于出场时机而非入场选择。

3.

CV AUC > 0.99 反映的是信号识别而非盈利预测

模型能精准识别"这个技术形态是否出现",但不能直接预测"这个信号会涨多少"。真正的盈利能力要看回测Lift和前瞻收益。

4.

暴力K模型存在数据泄漏

训练特征包含 fwd_max_ret、fwd_max_dd 等未来数据,导致训练AUC虚高。实际预测时这些特征填零,仅靠6/33个有效特征工作。

提升路线图

基于本次研究发现,5个方向可以进一步提升策略的实战效果

P0

信号质量评分(回归模型)

同一天触发的多个信号中,预测哪些后续涨幅更大。

投入:中 收益:高

核心思路

  • -标签改为 fwd_max_ret(5日最大涨幅)回归
  • -在现有28~37个特征上增加行业热度、市场情绪、资金流向
  • -LightGBM回归 + 分位数回归(预测收益区间)

预期效果

从每日N个信号中挑出Top 5最有潜力的股票,按预测分数分组后实际收益应单调递增。

适用: 补票(2,436信号) / 少妇(12,348信号)

P0

暴力K模型重构

修复数据泄漏和特征错位两个已知Bug。

投入:低 收益:中

修复步骤

  • 1.从训练特征中移除所有 fwd_* 特征
  • 2.统一 baolik_features.py 和 baolik_predict.py 的特征名
  • 3.用 configs.json 参数重新训练+回测

问题描述

训练含 fwd_max_ret 等未来数据(泄漏),预测时57个特征仅6/33匹配训练集。信号本身质量好(+8.48%最大涨幅,90%胜率)。

P1

最优出场时机

解决"什么时候卖"这个核心问题——所有信号都涨,但什么时候卖最赚?

投入:中 收益:高

核心思路

  • -分析 T+1 到 T+10 逐日胜率曲线,找"胜率拐点"
  • -建立"冲高回落预警"模型
  • -根据信号特征动态设定止盈/止损位

数据基础

已有5个战法的 fwd_ret_1d ~ fwd_ret_10d、fwd_max_ret、fwd_max_dd 完整前瞻数据,无需额外采集。

P1

多战法联合(共振信号)

当多个战法同时选中同一只股票时,信号更强。

投入:低 收益:中

统计历史上多战法重叠时的收益提升,建立"共振评分":被N个战法同时选中 → 评分加权。例如同一天少妇+补票同时选中某股票,信号可信度大幅提高。

P2

信号前预警(提前布局)

在信号正式触发前1-3天,提前发现"即将触发"的股票,不用追涨。

投入:高 收益:中

对每个信号取 T-3, T-2, T-1 的特征快照,训练模型预测"未来3天内会触发X战法信号"。适用于少妇(12,348信号样本充足)和补票(2,436信号)。

信号质量评分方案

从"能不能选到"转向"选到的哪个更好"——核心思路是把分类问题变成回归问题

当前方法的局限

  • x 二分类模型:只回答"是不是信号",不回答"这个信号有多好"
  • x AUC虚高:0.99+ 的AUC只说明模型能识别形态,不等于能预测涨幅
  • x Lift不稳定:填坑(0.96x)和上穿60(0.81x)的Lift < 1,说明Top-20选择不如随机

目标方案

  • + 回归模型:预测每个信号的 fwd_max_ret(5日最大涨幅),输出连续评分
  • + 质量排序:同一天的信号按预测分数排序,只取Top 5
  • + 分位数回归:不仅预测均值,还给出收益区间(如"5%~12%")

评分特征体系

技术面(已有)
  • KDJ J值 / 分位数
  • 价格偏离均线程度
  • ZX Spread(知行线差值)
  • BBI斜率 / 加速度
  • MACD DIF / 柱状值
  • 波动率 / ATR
行业/板块(新增)
  • 同行业近5日平均涨幅
  • 行业内信号股票占比
  • 板块轮动指标
  • 行业近20日动量排名
市场情绪(新增)
  • 大盘状态(牛市/震荡/熊市)
  • 当日涨停数 / 跌停数
  • 两市成交额/均值比
  • 北向资金净流入
个股基本面(新增)
  • 流通市值(大小盘)
  • 近5日日均换手率
  • 主力净流入(如有)
  • 所属概念板块热度

评估标准

评分模型是否有效,不看AUC,而看:

1

单调性

按预测分数分5组(Q1~Q5),实际收益是否 Q1 < Q2 < Q3 < Q4 < Q5?

2

Top组超额

Q5(最高分组)的平均收益是否显著高于全体信号?目标 > 2倍。

3

IC值

每日预测排名 vs 实际收益排名的Spearman相关系数,目标 IC > 0.05。

推荐实施顺序

Step 1

先在补票战法(样本2,436,Lift已225x)上验证回归方案。用已有37个特征训练LightGBM回归,看分组收益是否单调。

Step 2

效果好则扩展到少妇(12,348信号)。同时新增行业热度+市场情绪特征,观察IC提升。

Step 3

上线评分系统:每日扫描后,对触发信号的股票实时计算评分,仅推送Top 5。