之前在某乎上看见有人说银行信贷审批的职业是越老越值钱,本文基于客户过往信贷数据角度进行机器学习训练,来探讨该职位未来是否还可能存在,欢迎吐槽我没有考虑信审人员懂产品、懂客户、懂市场,懂流程、懂风险,只是从机器学习角度来考虑,基于信贷数据进行用户信贷分类,使用Logistic算法和KNN算法模构建型。
一、相关理论
1.1 机器学习知识点:
-
KNN:K近领算法,训练集中每一个样本都可以用其周围样本来代表。
-
KNN三大要素:K值的选择、邻近距离度量、分类规则决策
-
KNN代码公式:KNeighborsClassifier(n_neighbors=5,weights=’uniform’,algorithm=’kd_tree’,leaf_size=30,p=2,metric=’minkowski’)分别表示(邻近数目=默认5,样本权重=等权重,计算方式=kd树,叶子数量=默认30,样本距离=闵可夫斯基)
-
Logistic:二分类算法
-
LR代码:LogisticRegression()
1.2 环境配置
-
python3.6
-
安装包:pandas、numpy、matplotlib、sklearn。
二、相关代码
2.1数据来源
Credit Approval Data Set(伟大的UCI机器学习数据库,顺带了解下常用的数据来源网站?)
2.2信息描述
从信息描述来看属性有分类、整数、实数ÿ