![](https://img-blog.csdnimg.cn/20190927151053287.png?x-oss-process=image/resize,m_fixed,h_224,w_224)
天池金融挑战赛
阿里云天池与DataWhale联合赛笔记
温酒煮青梅
初级打工人
展开
-
天池-贷款违约挑战赛(五)-模型融合
目录学习目标学习内容stackingblending代码示例1、平均(简单、加权)2、投票(简单、加权)3、stacking4、blending总结 学习目标 将天池-贷款违约挑战赛(四)-建模与调参中介绍的模型进行融合 学习内容 模型融合的方法 1、 平均(简单、加权) 2、 投票(简单、加权) 3、 综合(排序融合、log融合) 4、 stacking(构建多层模型,并利用预测结果再拟合预测) 5、 blending(选取部分数据预测训练得到预测结果作为新特征,带入剩下的数据中预测。blending原创 2020-09-26 20:57:38 · 345 阅读 · 0 评论 -
天池-贷款违约挑战赛(四)-建模与调参
目录学习目标学习内容1. 逻辑回归2. 决策树模型3. 集成模型3.1 GBDT模型3.2 XGBoost模型3.3 LightGBM模型3.4 Catboost模型 学习目标 扫盲常用机器学习模型 学习机器学习模型的建模过程与调参流程 学习内容 逻辑回归模型 树模型 集成模型 模型对比与性能评估 模型调参 下面进入正题,由于是扫盲,内容会比较简单,随着以后的学习会不断记录有深度的机器学习内容 1. 逻辑回归 关于逻辑回归的数学推导,可以看一下大佬的这篇博客,讲的很详细 https://bl原创 2020-09-24 21:05:38 · 411 阅读 · 0 评论 -
天池-贷款违约挑战赛(三)-特征工程
提示:文章写完后,目录可以自动生成,如何生成可参考右边的帮助文档 文章目录前言一、学习目标二、代码示例1.引入库2.读入数据3.特征预处理3.1 缺失值总结 前言 本文是对天池-贷款违约挑战三的Task3-特征工程的记录 一、学习目标 特征预处理(缺失值、时间格式处理、特征转换为数值) 异常值处理(基于3segama、基于箱型图) 数据分箱(固定宽度、分位数) 特征交互(特征组合、特征衍生) 特征编码(one-hot、label-encode) 特征选择(Filter、wrapper、embedde原创 2020-09-21 19:42:45 · 353 阅读 · 0 评论 -
天池-贷款违约挑战赛(二)-数据分析
目录Task2-数据分析主要内容程序示例使用平台导入包读数据样本数量&特征数量数据完整性(缺失值nan)数据类型(离散/连续) Task2-数据分析 主要内容 了解数据集的统计信息,如数据完整性、是否存在奇异数据、数据类型(离散/连续)、特征关联 程序示例 使用平台 使用google colab,这个平台需要科学上网,你懂的。 本次比赛提供本地数据集,在colab中导入本地数据集的传送门在此 链接: 【嗖!传送门】. 导入包 import pandas as pd import numpy as n原创 2020-09-18 18:36:19 · 668 阅读 · 0 评论