- 博客(2)
- 收藏
- 关注
原创 机器学习 | Kaggle项目实战 | Credit Card Fraud Detection | 不平衡分类
信用卡欺诈是金融行业的重大问题,准确识别欺诈交易有助于保护消费者免受未授权费用,并维护金融系统的安全与信任。是Kaggle竞赛上的一个经典的不平衡分类项目。除了Kaggle上的原有项目外,也有很多大佬已经对该项目进行了复现。我接下来做的内容在一定程度上参考了他们优秀的博客,例如,大佬1大佬2大佬3。但是他们的工作也有一些问题。一个比较明显的问题是他们在数据采样后才划分数据集,然后训练模型,这非常容易导致数据泄露和过拟合,这一点我在后面也进行了说明。除修补一些小问题之外,我也在他们的基础做了一些自己的工作。
2025-07-23 17:27:47
1927
原创 Nemenyi 检验CD图的绘制/AttributeError: module ‘Orange.evaluation.scoring‘ has no attribute ‘compute_CD‘
背景:审稿人常常要求用统计检验方法比较模型性能。在比较模型性能的时候,Friedman检验和Nemenyi 后续检验是一套常用的组合拳。Nemenyi 后续检验的结果常常用CD图可视化出来。但我画CD图的时候遇到了很多问题,例如代码报错AttributeError: module 'Orange.evaluation.scoring' has no attribute 'compute_CD'。在参考了诸多大佬的解决方案后,终于绘制出了CD图。
2025-07-09 21:21:23
1256
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人
RSS订阅