机器学习
Audrey_Meng
言必信,行必果
展开
-
混淆矩阵
混淆矩阵(Confusion matrix)混淆矩阵是判断分类好坏程度的一种方法。另外还有ROC曲线和AUC曲线1.概念1)TN(True Negative):负类预测为正类(0->>1)2)FN(False Negative):负类预测为负类(0->&原创 2019-01-16 16:27:27 · 1275 阅读 · 0 评论 -
缺失值处理python实现
缺失值的处理由于各种原因,我们使用的数据集或多或少地存在着缺失值。如果直接删除缺失值,会丢失其他有价值的数据,以下是处理缺失值的几种方法。1. 直接删除        当缺失值的个数只占整体很小一部分的时候,可直接删除缺失值。但是如果缺失值占比上升,这种缺失值处理方法误差就很大了。&a原创 2019-02-22 14:10:29 · 28659 阅读 · 12 评论 -
评分卡模型python实现
评分卡模型首先来介绍几个名词变量分析:确定变量之间是否存在共线性,如存在高度相关,只保存最稳定、预测能力最高的那个。常用方法为VIF(variance inflation factor),即方差膨胀因子进行检验。变量分箱(binning):是对连续变量离散化的称呼。常用的有等距分段、等深分段、最优分段。单因子分析:检测各变量的强度,常用方法为:WOE、IV。单因子分析WOE(We...原创 2019-06-19 10:32:50 · 4703 阅读 · 4 评论