- 博客(8)
- 资源 (7)
- 收藏
- 关注
原创 kaggle 欺诈信用卡预测(由浅入深(二)之AutoEncoder+LogisticRegression)
在前一篇> kaggle 欺诈信用卡预测(由浅入深(一)之数据探索及过采样)我们利用SMOTE过采样和LogisticRegression来预测信用卡欺诈。现在我们利用样本类别本身的不平衡,用AutoEncoder来对特征进行表达,并将表达后的特征送入LogisticRegression。得到了好于SMOTE+LogisticRegression的效果。...
2019-03-26 10:53:22 4628 2
转载 GBDT,XGboost,Lightgbm,Catboost总结
mark一下,感谢作者分享!一、DBDT分裂GBDT使用的决策树就是CART回归树,无论是处理回归问题还是二分类以及多分类,GBDT使用的决策树自始至终都是CART回归树。 对于回归树算法来说最主要的是寻找最佳的划分点,那么回归树中的可划分点包含了所有特征的所有可取的值。在分类树中最佳划分点的判别标准是熵或者基尼系数,都是用纯度来衡量的,但是在回归树中的样本标签也是连续数值,所以再使用熵...
2019-03-20 20:37:51 4785 3
原创 kaggle 欺诈信用卡预测(由浅入深(一)之数据探索及过采样)
项目背景数据集包含由欧洲持卡人于2013年9月使用信用卡进行交的数据。此数据集显示两天内发生的交易,其中284,807笔交易中有492笔被盗刷。数据集非常不平衡,正类(被盗刷)占所有交易的0.172%。它只包含作为PCA转换结果的数字输入变量。不幸的是,由于保密问题,我们无法提供有关数据的原始功能和更多背景信息。特征V1,V2,… V28是使用PCA获得的主要组件,没有用PCA转换的唯一特征是...
2019-03-18 17:51:34 5943 3
转载 kaggle 欺诈信用卡预测
mark一下,感谢作者分享!https://www.cnblogs.com/bonelee/p/9087882.html
2019-03-12 15:22:34 1609
原创 图模型在反欺诈中的应用
最近在研究图模型在反欺诈中的应用,综合整理相关资料。在目前的工作中,线上用的是fast unfoloding社区发现算法。1、阿里团队公开了用无监督模型,防范信用卡欺诈(autoencoder)(非图);https://mp.weixin.qq.com/s?__biz=MzU5ODUxNzEyNA==&mid=2247484173&idx=1&sn=3d768cef544...
2019-03-04 17:44:22 3807 3
原创 爬虫开发整理
mark一下,感谢作者分享!https://www.cnblogs.com/bep-feijin/p/9067264.htmlhttps://www.cnblogs.com/bep-feijin/p/9067332.htmlhttps://www.cnblogs.com/bep-feijin/p/9088841.htmlhttps://www.cnblogs.com/bep-feijin/...
2019-03-03 09:47:22 177
推荐系统实践
2017-05-23
Stanford 教授 Andrew Ng 的 Deep Learning 教程
2017-05-23
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人