2019年03月_法相

12月 11月 10月 09月 08月 07月 05月 04月 03月 02月 01月

原创 kaggle 欺诈信用卡预测(由浅入深（二）之AutoEncoder+LogisticRegression)

在前一篇> kaggle 欺诈信用卡预测(由浅入深（一）之数据探索及过采样)我们利用SMOTE过采样和LogisticRegression来预测信用卡欺诈。现在我们利用样本类别本身的不平衡，用AutoEncoder来对特征进行表达，并将表达后的特征送入LogisticRegression。得到了好于SMOTE+LogisticRegression的效果。...

2019-03-26 10:53:22 4628 2

原创 kaggle 欺诈信用卡预测(由浅入深（三）之AutoEncoder+异常检测)

mark一下

2019-03-26 10:53:07 3334

转载 GBDT,XGboost,Lightgbm,Catboost总结

mark一下，感谢作者分享！一、DBDT分裂GBDT使用的决策树就是CART回归树，无论是处理回归问题还是二分类以及多分类，GBDT使用的决策树自始至终都是CART回归树。　　对于回归树算法来说最主要的是寻找最佳的划分点，那么回归树中的可划分点包含了所有特征的所有可取的值。在分类树中最佳划分点的判别标准是熵或者基尼系数，都是用纯度来衡量的，但是在回归树中的样本标签也是连续数值，所以再使用熵...

2019-03-20 20:37:51 4785 3

原创 kaggle 欺诈信用卡预测(由浅入深（一）之数据探索及过采样)

项目背景数据集包含由欧洲持卡人于2013年9月使用信用卡进行交的数据。此数据集显示两天内发生的交易，其中284,807笔交易中有492笔被盗刷。数据集非常不平衡，正类（被盗刷）占所有交易的0.172％。它只包含作为PCA转换结果的数字输入变量。不幸的是，由于保密问题，我们无法提供有关数据的原始功能和更多背景信息。特征V1，V2，… V28是使用PCA获得的主要组件，没有用PCA转换的唯一特征是...

2019-03-18 17:51:34 5943 3

转载 kaggle 欺诈信用卡预测

mark一下，感谢作者分享！https://www.cnblogs.com/bonelee/p/9087882.html

2019-03-12 15:22:34 1609

原创准确率(Accuracy), 精确率(Precision), 召回率(Recall)

mark一下

2019-03-08 17:59:00 557

原创图模型在反欺诈中的应用

最近在研究图模型在反欺诈中的应用，综合整理相关资料。在目前的工作中，线上用的是fast unfoloding社区发现算法。1、阿里团队公开了用无监督模型，防范信用卡欺诈（autoencoder）（非图）；https://mp.weixin.qq.com/s?__biz=MzU5ODUxNzEyNA==&amp;mid=2247484173&amp;idx=1&amp;sn=3d768cef544...

2019-03-04 17:44:22 3807 3

原创爬虫开发整理

mark一下，感谢作者分享！https://www.cnblogs.com/bep-feijin/p/9067264.htmlhttps://www.cnblogs.com/bep-feijin/p/9067332.htmlhttps://www.cnblogs.com/bep-feijin/p/9088841.htmlhttps://www.cnblogs.com/bep-feijin/...

2019-03-03 09:47:22 177