自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(8)
  • 资源 (1)
  • 收藏
  • 关注

原创 贷款逾期(8)---随机深林挑选特征和iv

任务分别用IV值和随机森林挑选特征,再构建模型,进行模型评估IV值选择特征#!/user/bin/env python#-*- coding:utf-8 -*-# @Time : 2018/11/27 21:08# @Author : 刘# @Site : # @File : RandomForest.py# @Software: PyCharmim...

2018-11-28 23:06:57 237

原创 贷款逾期(7)---stacking

任务【任务七-模型融合】用你目前评分最高的模型作为基准模型,和其他模型进行stacking融合,得到最终模型及评分。Stacking原理:Stacking模型本质上是一种分层的结构。第一层使用5-折交叉验证,5折交叉验证就是先拿出四折作为training data,另外一折作为testing data。注意:在stacking中此部分数据会用到整个traing s...

2018-11-26 19:04:41 580

原创 贷款逾期(6)-交叉验证

任务使用网格搜索对模型进行调优并采用五折交叉验证的方式进行模型评估。1.网格搜索网格搜索1.1 什么是Grid Search 网格搜索?网格搜索是一种调参手段;在所有候选的参数选择中,通过循环遍历,尝试每一种可能性,表现最好的参数就是最终的结果。其原理就像是在数组里找最大值。(为什么叫网格搜索?以有两个参数的模型为例,参数a有3种可能,参数b有4种可能,把所有可能性列出来,可以...

2018-11-24 17:08:04 1430

原创 贷款逾期(5)--特征处理

任务描述关于数据类型转换以及缺失值处理(尝试不同的填充看效果)以及你能借鉴的数据探索遇到的问题SVM模型训练时一直卡住不动,【原因是数据没有标准化或者是归一化】特征处理1删除无用变量无用变量比如一个类只有唯一属性(人类只用男性),若加入模型训练且对最终模型生效的话,很可能就是出现了过拟合data.drop(['id_name', 'custid', 'trade_no...

2018-11-22 18:02:26 676

原创 贷款逾期(4)--五个模型整合

模型评估import picklefrom matplotlib import pyplot as pltfrom sklearn.externals import joblibfrom sklearn.metrics import accuracy_score, recall_score, f1_score, roc_auc_score, roc_curvepath = "E:/...

2018-11-20 21:40:01 711

原创 贷款逾期(3)--XGBoost与Lightgm

任务三构建xgboost和lightgbm模型进行预测。遇到的问题参数不知道怎么调用 xgboost的接口和sklearn接口不明白 LGB和XGB自带接口预测(predict)的都是概率 训练之前都要将数据转化为相应模型所需的格式代码特征处理import pickleimport pandas as pd #数据分析from pandas import S...

2018-11-18 18:19:21 907

原创 贷款逾期(2)--SVM与DT

一、任务使用SVM和决策树两种算法预测贷款用户是否会逾期。二、分析数据分析对缺失值进行处理 对包含中文数据进行映射 对两个时间的不确定进行删除三、代码实现import pandas as pdfrom sklearn.model_selection import train_test_splitfrom pandas import Series,DataFrame...

2018-11-16 20:31:06 639

原创 贷款逾期--逻辑回归(1)

主要根据数据集来建立一个逻辑回归模型数据集来源https://pan.baidu.com/s/1izJZerx0lfvQX6YRKYWv-g主要问题是根据数据建立一个逻辑回归模型来预测贷款是否逾期。下面是对其进行编写的代码:主要分为五步:1.数据分析对缺失值进行处理 对包含中文数据进行映射 对两个时间的不确定进行删除2.划分训练集和验证集,验证集比例为test_siz...

2018-11-15 12:00:18 659 2

dm03_namespace.cpp

dm03_namespace.cpp

2021-12-11

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除