自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 利用R语言对贷款客户作风险评估(下)——零膨胀回归分析

利用R语言对贷款客户作风险评估(下)——零膨胀回归分析前言上一篇的分类预测是决定好坏客户的初步判断, 不足以直接决策, 因此还需要进一步分析. 通过随机森林, 对影响好坏客户的解释变量的重要性进行排序. 由结果可以得出, 六个月内的还款状态是决定客户是非为好客户的最为重要的影响因素.因此, 本部分将由六个月的还款状态产生新的新的因变量, 即逾期还款次数, 其他变量作为解释变量, 从而研究影响逾...

2020-01-01 20:14:51 2991

原创 利用R语言对贷款客户作风险评估(中)——不平衡数据的分类问题

利用R语言对贷款客户作风险评估(中)——不平衡数据的分类问题前言上一篇是对数据简单的处理和数据探索,接下来开始对数据建立模型,本篇的内容是不平衡数据的分类问题。本文的数据中好坏数据作为因变量属于不平衡的二分类问题。阐述不平衡分类问题实际的数据常常会出现类分布不平衡的数据,而少数类更具有研究价值,因此人们更加关注的是少数类的正确分类。然而,传统的分类器通常由于其面向整体的准确性度量,从而忽略...

2019-12-30 23:04:02 1612

原创 利用R语言对贷款客户作风险评估

利用R语言对贷款客户作风险评估(上)——数据分析前言风险控制能力越来越成为互联网金融行业的隐形门槛,为风控人员提供显著地风险评估依据变得非常重要。本文以银行客户的信用卡信息为案例数据,对数据进行分析为信贷管理的风控人员提供风险评估依据。本文做以下几方面的工作:处理原始数据,进行数据探索好坏客户为因变量,处理不平衡数据的二分类问题将逾期还款次数作为新的因变量做零膨胀回归问题,旨在为信贷管...

2019-12-30 21:50:41 3069 4

原创 Tensorflow1.0&Tensorflow2.0与pytorch框架的比较

Tensorflow1.0&Tensorflow2.0与pytorch的比较前言最近开始学习Tensorflow框架,了解到最新发布了Tensorflow2.0,这比1.0更为简单强大。对于上路新手或许是一样好事,本文结合pytorch一起进行一个比较,有对比就会有新收获嘛!简单比较有不少文章分别对Pytorch,Tensorflow进行了详细介绍,对于新手的我也还在学习,就不再赘...

2019-12-28 22:15:33 1882

原创 利用python建立客户流失预警模型(下)——建立模型部分

利用python建立客户流失预警模型(下)——建立模型前言上一部分已经完成了对数据的整理与分析,接下来建立数据分析模型。首先,建立分类模型来预测客户是否会流失。逻辑回归,决策树,随机森林,xgboost等可用于分类问题(也可用于回归问题)。由于不是所有模型在所有样本预测均为最优,可考虑使用模型融合。在建模时,通过交叉验证训练集来得到模型最优的参数。对于阈值的设置可考虑KS曲线的最大值。其次...

2019-12-28 19:38:58 2569

原创 利用python建立客户流失预警模型(上)——数据处理部分

利用python建立客户流失预警模型(上)——数据处理部分前言看了不少文章受益匪浅,我也来在这里尝试总结一下自己运用到的,旨在和大家一起交流学习,请各位大佬多多指教。下面进入正题,数据为商业银行的商业数据,将数据集分为训练集和测试机:1、构建客户流失预警模型(bad_good为被解释变量);2、通过相关变量构建客户画像系统;3、根据两个模型,提出流失客户的应对策略我将从数据处理和模型...

2019-12-28 17:12:03 2970 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除