多标签文本分类中使用captum

最新推荐文章于 2024-09-25 08:54:30 发布

伪造的时空

最新推荐文章于 2024-09-25 08:54:30 发布

阅读量1.9k

点赞数 1

分类专栏： python 文章标签： python

本文链接：https://blog.csdn.net/gengziqiang1/article/details/124010890

版权

本文介绍了如何在多标签文本分类任务中运用Captum进行模型解释。通过调整 Captum 的 attribute 函数参数，特别是inputs、additional_forward_args和target，以适应多分类场景。关键在于模型的输出应为 n_steps*类别数，以匹配attribute函数的n_steps参数。此外，详细阐述了如何处理inputs和additional_forward_args以匹配模型forward函数的输入要求。

摘要由CSDN通过智能技术生成

captum在官网上给出了文本分类的例子（Captum · Model Interpretability for PyTorch），这是一个二分类模型，但对于多分类模型，却没有给出例子来，经过自己的实践，完成了多标签文本分类的可解释模型。

其实主要就是lig.attribute这个函数，关于函数的说明，详见：Lib\site-packages\captum\attr\_core\layer\layer_integrated_gradients.py这个文件中的attribute函数，函数的参数里面都有说明，inputs是一个tensor格式数据或tuple格式数据，这和模型forword中的输入要一致，一般我们直接传入token_ids，有可能还会有token_mask等，我们可以借助additional_forward_args这个参数，如果使用additional_forward_args，模型中forword也需要有相关的参数。若不使用additional_forward_args这个参数，则inputs需要传入tuple。

lig.attribute((input_ids,decoder_input_ids), baselines=(reference_indices,dec_reference_indices),.....)

对于多分类，一定要指定target这个参数，这个参数要和预测到的类别一致，比如预测到的类别为5，那么target=5。

另外一点就是模型的输出了，要是用captum解释多分类，模型的输出是要改变的，比如有10个类别，模型的输出为 1*10。表示10个类别是否存在的概率，但lig.attribute函数中有个参数为n_steps，默认为50，所有模型的输出也要为 n_steps*10。简单的改写为：

output = output.reshape(-1,num_class)

基本就这些了......

最低0.47元/天解锁文章

伪造的时空

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录