SHAP显示原始特征

1.问题描述

SHAP用于特征解释,对于机器学习方法往往需要对原始特征进行编码,而SHAP在绘制单个样本时,会显示每个特征及其取值,而这个取值已经是编码后的,通常无法确定其含义。如:
下图所示的拍卖公司、城市和作者信息。
在这里插入图片描述
预期达到的效果:
在这里插入图片描述

2.实现代码

将原始的shap_value传入自定义类实例中,使用新实例绘制即可

完整代码

#定制类以修改显示出来的特征名
class MyExplanation(shap._explanation.Explanation):
   def __init__(self,shap_value,column_names):
      super(MyExplanation,self).__init__(shap_value)
      self.values = shap_value.values
      self.base_values = shap_value.base_values
      self.feature_names = shap_value.feature_names
      self.data = []
      data = list(shap_value.data[0])
      #遍历特征名
      for i,feature_name in enumerate(self.feature_names):
         self.data.append(data[i])
         #如果特征名需要修改
         if feature_name in column_names:
            self.data[i] = column_names[feature_name]
      #原始data为[[]]类型
      self.data = [self.data]

my_shap_value = MyExplanation(shap_value,{"作者":"佚名","拍卖城市":"北京","拍卖公司":"保利"})
my_shap_value

对比效果:

在这里插入图片描述
在这里插入图片描述

3.解决思路

(1)研究shap_value属性

发现其特征取值就是data,只需要修改data值即可,然而该属性私有化了,无法直接修改

(2)研究shap_value的类型

发现是shap._explanation.Explanation类型,于是尝试继承该类,实验可行
在这里插入图片描述

4.提示

(1) 关于中文乱码修改字体解决而负号依旧乱码问题

设置的字体必须兼容中英文,负号属于英文字符

import matplotlib.pyplot as plt
#设置字体(必须兼容中英文,否则负号会出现问题)
plt.rcParams["font.sans-serif"]=["Microsoft YaHei"] 
#该语句解决图像中的“-”负号的乱码问题
plt.rcParams["axes.unicode_minus"]=False 
  • 1
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值