![](https://img-blog.csdnimg.cn/20201014180756927.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
数据竞赛
格拉迪沃
这个作者很懒,什么都没留下…
展开
-
个人信贷评估模型研究
个人信贷评估模型研究数据初探和可视化分析介绍一般信息统计数据分布好贷款与坏贷款贷款类型各地区发放的贷款深入研究不良贷款商业视角了解业务的操作方面按收入类别分析评估风险了解业务的风险方面信用评分的重要性不良贷款的决定因素目的的风险数据清洗数据过滤过滤缺失值多的特征过滤重复值特征经验性过滤数据更改数据类型缺失值处理缺失值处理——分类变量缺失值处理——数值变量特征工程特征衍生特征抽象分箱特征缩放(Fea...原创 2019-05-09 09:30:52 · 2674 阅读 · 0 评论 -
优雅高效地数据挖掘:sklearn_pandas库使用说明
优雅高效地数据挖掘:sklearn_pandas库使用说明概述概述先马克一下,以后整理,推荐阅读:http://www.cbdio.com/BigData/2016-08/31/content_5227769.htmhttps://zhuanlan.zhihu.com/p/37880492...原创 2019-05-27 10:34:22 · 310 阅读 · 0 评论 -
华为2019算法大赛CTR预估数据探索
华为2019算法大赛CTR预估数据探索训练集时间信息siteId(媒体Id)slotId(广告位Id)netType(网络连接类型)id类信息测试集媒体id网络型号测试集与训练集分布adID训练集这个训练集有159837655个样本,负样本1.5亿,剩下的是正样本;比例约为15:1时间信息时间信息有很多杂乱值,主要是2019年三月26到31日的信息,train['operTime'] =...原创 2019-05-23 17:22:47 · 3418 阅读 · 7 评论 -
CCKS2019—面向金融的事件主题识别思路分享
CCKS2019-面向金融的事件主题识别思路分享1.题目概述2.方法探索3.用bert模型进行迁移学习4.答案规则的尝试5.模型的训练和调优6.赛后总结6.1不足和遗憾6.2展望1.题目概述本次赛题的本质是nlp的阅读...原创 2019-08-18 09:14:23 · 3564 阅读 · 0 评论