常用CV策略及对抗验证(Adversarial validation)

常用CV策略:
Hold-out; Kfold, GroupKFold, StratifiedKFold, TimeSeriesSplit

Adversarial validation(对抗验证)
概念:是一种常用的特征筛选方法,用于找出时序波动明显的特征。
操作:

  1. 对划分的训练集和验证集(测试集)进行二元编码, e.g. 训练集增加一个ad_target=1,验证集增加一个ad_target=0
  2. 训练一个简单的二分类模型,目标是对ad_target做二分类
  3. 每次训练只使用一个特征,记录模型收敛时验证集的AUC
  4. 迭代步骤3直到遍历所有特征,对特征按照AUC指标从高到底排序
  5. 重点分析AUC较高,经验阈值可以选0.7,0.8;注意缺失值问题

对抗验证(解决CV扰动);用分布观察特征

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值