金融数据时间序列分析——模型准确率过高怎么办

多少年后,小f想起了自己还是刚刚出道的小萌新时候犯的一个错误,当时模型的准确率贼高,高的离谱,就像下面这种情况

              precision    recall  f1-score   support

          -1       1       1       1           1934
           0       1       1       1            535
           1       1       1       1           1624

   micro avg       1       1       1           4093
   macro avg       1       1       1           4093
weighted avg       1       1       1           4093

 

大佬走过来,瞄了一眼说,肯定是数据偷窥了。(意思就是去)

于是他慌了,调整数据训练集和测试集的比例,没卵用,0.1:0.99也不成,完了完了;接着调整因子呢?或者说features,100多个因子,找到了点数据偷窥的根据,你看这个因子用了全数据集的rank,嗯,使用了下面测试集的数据,有道理有道理,然后,删到了10来个,噢,随机森林的叶子和决策树的数目也要调过来,改一下改一下,花了将近一天时间来做这个。满心欢喜重新开始——

然后。。。

 

              precision    recall  f1-score   support

          -1       1       1       1           1934
           0       1       1       1            535
           1       1       1       1           1624

   micro avg       1       1       1           4093
   macro avg       1       1       1           4093
weighted avg       1       1       1           4093

。。。场面一度非常尴尬~~~

直到这时,人们才想起来了按步debug这个破局之策~~~

因子不能手算吧,况且公式我们还检查过了,扔了很多因子呢。

看看列的头吧,嗯。??

用来计算label,也就是y值的列怎么混到X里面来了???mmp

一言以敝之,数据偷窥了,除了这个没有别的可能嗯,尤其是这么离谱的准确率,一般的偷窥还做不到吧

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

量化橙同学

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值