- 博客(6)
- 收藏
- 关注
原创 阿里云天池学习赛【金融风控-贷款违约预测】task5
零基础入门金融风控-贷款违约预测TASK 55模型融合5.1融合方法5.1.1voting(投票)5.1.2 Averaging(平均)5.1.3 Bagging5.1.4 Stacking5模型融合通过融合多个不同的模型,可能提升机器学习的性能5.1融合方法5.1.1voting(投票)投票制的方法,投票多者确定为最终的分类。包含:1.简单投票2.加权投票5.1.2 Averaging(平均)一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。包含:1.简单平均;pr
2020-09-27 16:56:11 522
原创 阿里云天池学习赛【金融风控-贷款违约预测】task4
零基础入门金融风控-贷款违约预测TASK 44.建模以及调参4.1逻辑回归模型4.2决策树4.3集成方法4.3.1分类4.3.2 boosting4.3.3 bagging4.3.4 stacking4.4 数据集划分4.5 建模4.建模以及调参4.1逻辑回归模型1.逻辑回归算法的名字里虽然带有“回归”二字,但实际上逻辑回归算法是用来解决分类问题的。 简单来说, 逻辑回归(Logistic Regression)是一种用于解决==二分类==(0 or 1)问题的机器学习方法, 用于估计某种事物
2020-09-24 16:07:47 1108
原创 阿里云天池学习赛【金融风控-贷款违约预测】task3
零基础入门金融风控-贷款违约预测TASK 33.特征工程3.1时间格式处理3.2类别特征的处理3.3连续型变量的处理3.4 特征选择3.特征工程3.1时间格式处理issueDate属性:// 查看贷款发放的最早月份train.sort_index(by='issueDate')['issueDate'];//按照issueDate索引排序;// 查询到最早的日期为:2007-06-01;转换成时间格式:for data in [train, testA]: data['issu
2020-09-21 15:53:07 663
原创 阿里云天池学习赛【金融风控-贷款违约预测】task 2
零基础入门金融风控-贷款违约预测TASK 22.探索性数据分析(EDA)二级目录2.探索性数据分析(EDA)了解数据,熟悉数据,为后续的特征工程做准备。探索性数据分析(Exploratory Data Analysis,简称EDA),是指一种分析数据集以概括其主要特征的方法,通常使用可视化方法。为之后的数据预处理和特征工程提供必要的结论。目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接 下来的机器学习或者深度学习建模;2.了解变量间的
2020-09-18 16:35:51 716
原创 阿里云天池学习赛【金融风控-贷款违约预测】task 1
零基础入门金融风控-贷款违约预测赛题理解一、赛题数据二、数据概况三、评价标准1. ROC(Receiver Operating Characteristic)2. AUC(Area Under Curve)AUC值对模型性能的判断标准总结赛题理解赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。一、赛题数据赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据
2020-09-15 10:12:56 692
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人