特征筛选
小小数据挖掘工程师
即将毕业小硕一枚,记录自己编程学习生涯!可以交个朋友吗?一起撸代码鸭!
展开
-
可解释的机器学习库—SHAP
1.SHAP介绍SHAP(SHapley Additive exPlanations),是Python开发的一个“模型解释”包,它可以解释任何机器学习模型的输出。 所有的特征都被视为“贡献者”。 对于每个预测样本,模型都产生一个预测值,SHAP value就是该样本中每个特征所分配到的数值。 SHAP值从预测中把每一个特征的影响分解出来,可应用于如下场景中:模型认为银行不应该给某人放贷,但是法律上需要银行给出每一笔拒绝放贷的原因。 医务人员想要确定对不同的病人而言,分别是哪些因素导致他们有患某原创 2020-11-09 16:12:02 · 14302 阅读 · 4 评论 -
特征筛选之—IV值
一.定义IV(Infromation Value),信息价值,用来表示特征对目标预测的贡献程度,即特征的预测能力,一般来说,IV值越高,该特征的预测能力越强,信息贡献程度越高。二.限定条件IV值的计算有一定的限定条件:(1)面向的任务必须是有监督的任务;(2)预测目标必须是二分类的。三.IV取值区间及常用评价基准IV值的取值区间为:[0,正无穷)。IV值取值含义:(1)IV<0.02:无用特征(2)0.02<IV<0.1:弱价值特征(3)0.1&原创 2020-11-06 18:23:14 · 27760 阅读 · 0 评论