![](https://img-blog.csdnimg.cn/20190927151053287.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
天池金融挑战赛
阿里云天池与DataWhale联合赛笔记
温酒煮青梅
初级打工人
展开
-
天池-贷款违约挑战赛(五)-模型融合
目录学习目标学习内容stackingblending代码示例1、平均(简单、加权)2、投票(简单、加权)3、stacking4、blending总结学习目标将天池-贷款违约挑战赛(四)-建模与调参中介绍的模型进行融合学习内容模型融合的方法1、 平均(简单、加权)2、 投票(简单、加权)3、 综合(排序融合、log融合)4、 stacking(构建多层模型,并利用预测结果再拟合预测)5、 blending(选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。blending原创 2020-09-26 20:57:38 · 347 阅读 · 0 评论 -
天池-贷款违约挑战赛(四)-建模与调参
目录学习目标学习内容1. 逻辑回归2. 决策树模型3. 集成模型3.1 GBDT模型3.2 XGBoost模型3.3 LightGBM模型3.4 Catboost模型学习目标扫盲常用机器学习模型学习机器学习模型的建模过程与调参流程学习内容逻辑回归模型树模型集成模型模型对比与性能评估模型调参下面进入正题,由于是扫盲,内容会比较简单,随着以后的学习会不断记录有深度的机器学习内容1. 逻辑回归关于逻辑回归的数学推导,可以看一下大佬的这篇博客,讲的很详细https://bl原创 2020-09-24 21:05:38 · 415 阅读 · 0 评论 -
天池-贷款违约挑战赛(三)-特征工程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档文章目录前言一、学习目标二、代码示例1.引入库2.读入数据3.特征预处理3.1 缺失值总结前言本文是对天池-贷款违约挑战三的Task3-特征工程的记录一、学习目标特征预处理(缺失值、时间格式处理、特征转换为数值)异常值处理(基于3segama、基于箱型图)数据分箱(固定宽度、分位数)特征交互(特征组合、特征衍生)特征编码(one-hot、label-encode)特征选择(Filter、wrapper、embedde原创 2020-09-21 19:42:45 · 355 阅读 · 0 评论 -
天池-贷款违约挑战赛(二)-数据分析
目录Task2-数据分析主要内容程序示例使用平台导入包读数据样本数量&特征数量数据完整性(缺失值nan)数据类型(离散/连续)Task2-数据分析主要内容了解数据集的统计信息,如数据完整性、是否存在奇异数据、数据类型(离散/连续)、特征关联程序示例使用平台使用google colab,这个平台需要科学上网,你懂的。本次比赛提供本地数据集,在colab中导入本地数据集的传送门在此链接: 【嗖!传送门】.导入包import pandas as pdimport numpy as n原创 2020-09-18 18:36:19 · 677 阅读 · 0 评论