金融风控
Scarlett_can
这个作者很懒,什么都没留下…
展开
-
[Datawhale学习小组]_金融风控_Task2数据分析
Task2-数据分析EDA数据总体了解缺失值和唯一值深入数据-查看数据类型数据间相关关系用pandas_profiling 生成数据报告 EDA 数据总体了解 读取数据集并了解数据集大小,原始特征维度 读取数据的扩展知识 :对于文件特别大的场景,通过nrows参数,来设置读取文件的前多少行;分块读取 通过info熟悉数据类型 粗略查看数据集中各特征基本统计量 缺失值和唯一值 查看数据缺失值 查看唯一值特征情况 深入数据-查看数据类型 类别型数据 数值型数据 离散数值型数据 连续数值型数据原创 2020-09-18 22:18:45 · 237 阅读 · 0 评论 -
[Datawhale学习小组]_金融风控_Task1赛题理解
Task1-赛题理解学习目标赛题概况数据概况预测指标导入数据 学习目标 先给自己定一个学习目标: 再锻炼锻炼分类建模的数据挖掘/代码/调参/可视化报告 很有正式的打过比赛,想尝试一下,积累经验 培养手感 赛题概况 数据概况 数据量 超过120w,包含47个特征,其中15个事匿名变量。80w作为训练集,20w作为测试集A,20w作为测试集B。一些信息进行了脱敏(没有变量名) 预测指标 采用AUC 作为评价指标 ROC曲线:True Positive Rate(TPR) v.s. False Posi原创 2020-09-15 22:31:17 · 365 阅读 · 0 评论