有了这些分类算法函数,跟烦人的算法代码说BYEBYE!
原创: 金科应用研院
经过了数据预处理和模型特征选择以及降维之后,就要使用数据进行模型的开发,小编这里给大家介绍一些sklearn库中可实现的模型算法,仅仅通过调参就可以快速开发出一版不错的评分卡模型。分类算法基础篇
1、线性判别分析LDA函数:sklearn.discriminant_analysis.
LinearDiscriminantAnalysis用法:from sklearn.discriminant_analysis
import LinearDiscriminantAnalysis
#线性判别分析法
#参数solver为求解最优问题算法
IDA= LinearDiscriminantAnalysis(solver="svd", store_covariance=True)
IDA.fit(X,y)
2、支持向量机SVM
SVM是二分类器,线性SVM分类是画出一条决策边界,使得到两个类样本的最短距离最大。函数:sklearn.svm用法:from sklearn import svm
#支持向量机
#参数kernel为核函数,C为惩罚系数
clf=svm.SVC()
clf.fit(X,y)
3、KNN算法
KNN是通过测量不同特征值之间的距离进行分类。函数:sklearn.neighbors用法:from sklearn import neighbors
#KNN邻近算法
#参数n_neighbors为K值,weights为权重
clf=neighbors.KNeighborsClassifier(n_neighbors,weights=weights)
clf.fit(X,y)
4、神经网络函数:sklearn.neural_network.MLPCLassifier用法:from sklearn.neural_network import MLPCLassifier
#人工神经网络多层感知分类器
#参数solver表示权重优化方法,alpha表示正则化项参数,hidden_layer_sizes 表示隐藏层数及每次包含神经元数量
clf = MLPClassifier(solver='lbfgs', alpha=1e-5,
hidden_layer_sizes=(5, 2), random_state=1)
clf.fit(X,y)
5、决策树算法
采用自顶向下的递归的方法,基本思想是以信息熵为度量构造一棵熵值下降最快的树,到叶子节点处熵值为0函数:sklearn.tree用法:from sklearn.import tree
#决策树分类器
clf= tree.DdecisionTreeClassifier()
clf.fit(X,y)
微信公众号搜索:「 金科应用研院」
可以从菜单栏点击「在线学习」
更多风控培训课程与干货学习资料,都在微信公众号
回复关键字: 「风控量化福利包」➡️领取干货学习资料
回复任意词可以加我们官方微信加入百人风控学习群
不定期分享干货资料,与行业内总监大咖一起讨论风控经验~