自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

转载 转---大数据之路:阿里巴巴大数据实践

转---大数据之路:阿里巴巴大数据实践

2022-08-12 13:57:26 250

原创 阿里云天池学习赛【金融风控-贷款违约预测】task5

零基础入门金融风控-贷款违约预测TASK 55模型融合5.1融合方法5.1.1voting(投票)5.1.2 Averaging(平均)5.1.3 Bagging5.1.4 Stacking5模型融合通过融合多个不同的模型,可能提升机器学习的性能5.1融合方法5.1.1voting(投票)投票制的方法,投票多者确定为最终的分类。包含:1.简单投票2.加权投票5.1.2 Averaging(平均)一个简单直接的思路是取平均。稍稍改进的方法是进行加权平均。包含:1.简单平均;pr

2020-09-27 16:56:11 522

原创 阿里云天池学习赛【金融风控-贷款违约预测】task4

零基础入门金融风控-贷款违约预测TASK 44.建模以及调参4.1逻辑回归模型4.2决策树4.3集成方法4.3.1分类4.3.2 boosting4.3.3 bagging4.3.4 stacking4.4 数据集划分4.5 建模4.建模以及调参4.1逻辑回归模型1.逻辑回归算法的名字里虽然带有“回归”二字,但实际上逻辑回归算法是用来解决分类问题的。 简单来说, 逻辑回归(Logistic Regression)是一种用于解决==二分类==(0 or 1)问题的机器学习方法, 用于估计某种事物

2020-09-24 16:07:47 1108

原创 阿里云天池学习赛【金融风控-贷款违约预测】task3

零基础入门金融风控-贷款违约预测TASK 33.特征工程3.1时间格式处理3.2类别特征的处理3.3连续型变量的处理3.4 特征选择3.特征工程3.1时间格式处理issueDate属性:// 查看贷款发放的最早月份train.sort_index(by='issueDate')['issueDate'];//按照issueDate索引排序;// 查询到最早的日期为:2007-06-01;转换成时间格式:for data in [train, testA]: data['issu

2020-09-21 15:53:07 663

原创 阿里云天池学习赛【金融风控-贷款违约预测】task 2

零基础入门金融风控-贷款违约预测TASK 22.探索性数据分析(EDA)二级目录2.探索性数据分析(EDA)了解数据,熟悉数据,为后续的特征工程做准备。探索性数据分析(Exploratory Data Analysis,简称EDA),是指一种分析数据集以概括其主要特征的方法,通常使用可视化方法。为之后的数据预处理和特征工程提供必要的结论。目的:1.EDA价值主要在于熟悉了解整个数据集的基本情况(缺失值,异常值),对数据集进行验证是否可以进行接 下来的机器学习或者深度学习建模;2.了解变量间的

2020-09-18 16:35:51 716

原创 阿里云天池学习赛【金融风控-贷款违约预测】task 1

零基础入门金融风控-贷款违约预测赛题理解一、赛题数据二、数据概况三、评价标准1. ROC(Receiver Operating Characteristic)2. AUC(Area Under Curve)AUC值对模型性能的判断标准总结赛题理解赛题以金融风控中的个人信贷为背景,要求选手根据贷款申请人的数据信息预测其是否有违约的可能,以此判断是否通过此项贷款,这是一个典型的分类问题。一、赛题数据赛题以预测用户贷款是否违约为任务,数据集报名后可见并可下载,该数据来自某信贷平台的贷款记录,总数据

2020-09-15 10:12:56 692

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除