竞赛
z.d.k
这个作者很懒,什么都没留下…
展开
-
竞赛-贷款违约预测-05 模型融合
一、目标将之前建模调参的结果进行模型融合,尝试多种融合方案二、内容平均简单平均法加权平均法投票简单投票法加权投票法综合:排序融合log融合stacking:构建多层模型,并利用预测结果再拟合预测。blending:选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。boosting/bagging(在Task4中已经提及,就不再赘述)...原创 2020-09-27 22:18:42 · 141 阅读 · 0 评论 -
竞赛-贷款违约预测-02 探索性数据分析(EDA——Exploratory Data Analysis)
目标:学习如何对数据集整体概况进行分析,包括数据集的基本情况(缺失值,异常值)学习了解变量间的相互关系、变量与预测值之间的存在关系内容:数据总体了解:读取数据集并了解数据集大小,原始特征维度;通过info熟悉数据类型;粗略查看数据集中各特征基本统计量;缺失值和唯一值:查看数据缺失值情况查看唯一值特征情况深入数据-查看数据类型类别型数据数值型数据- 离散数值型数据- 连续数值型数据数据间相关关系特征和特征之间关系特征和目标变量之间关系用pan原创 2020-09-18 23:54:56 · 1282 阅读 · 0 评论 -
竞赛-贷款违约预测-03 特征工程(纯理论)
1. 目标1.1 学习特征预处理、缺失值、异常值处理、数据分桶等特征处理方法1.2 学习特征交互、编码、选择的相应方法1.3 完成相应学习打卡任务,两个选做的作业不做强制性要求,供学有余力同学自己探索2. 内容2.1 数据预处理 2.1.1 缺失值的填充 2.1.2 时间格式处理 2.1.3 对象类型特征转换到数值2.2 异常值处理2.2.1基于3segama原则2.2.2 基于箱型图2.3 数据分箱2.3.1 固定宽度分箱2.3.2 分位数分箱 - 离散数值型数据分箱原创 2020-09-21 23:49:51 · 2188 阅读 · 0 评论 -
竞赛-贷款违约预测-01 赛题理解
Object: 赛题理解Key Result:理解赛题数据和目标清楚评分体系。理解赛题的解题思路。1. 赛题数据和目标比赛地址:https://tianchi.aliyun.com/competition/entrance/531830/information1.1赛题数据sample_submit.csv两列,id,isDefaultid取值范围:[800000,999999]isDefault取值0.5testA.csv测试数据集20万条数据48列数据:id,原创 2020-09-15 23:36:00 · 567 阅读 · 0 评论