All mistakes are not equal: Comprehensive Hierarchy Aware Multi-label Predictions (CHAMP)

红酒暖心也暖胃

于 2022-08-15 16:31:09 发布

阅读量484

点赞数

分类专栏： nlp 文章标签：人工智能机器学习深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zpp13hao1/article/details/126346946

版权

CHAMP是一种新的方法，针对层级多标签分类问题，通过量化错误预测的严重性来改进预测。该方法引入了根据层级树结构调整的损失函数，提高了精度和召回率。实验涵盖多模态数据，并提供了TensorFlow代码实现。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

All mistakes are not equal: Comprehensive Hierarchy Aware Multi-label Predictions (CHAMP)

abstract

这篇论文考虑层级多标签分类（HMC）已存在的问题：每个样本可以存在多个标签；标签基于一颗领域内的层级树。基于所有错误不平等的直觉，我们提出Comprehensive hierarchy aware multi-label predictions（CHAMP），根据层次结构树的严重性对错误预测进行惩罚。基于此的单标签的工作有，而多标签的工作很少，主要原因是没有明确的先验方法来量化多标签设置中错误预测的严重性。多模态（text、audio、image）做实验。
因为没有办法直接量化预测值和真实值之间的距离，所以多标签一直用BCE做loss损失，本论文引入简单的距离公式解决这一问题，且效果提升较多。

preliminaries and problem setting

${(x_i,y_i):i=1,...,n\}$ 有标签的训练样本，其中 $x_i\in|R^d$ 是输入样本， $y_i\in \{0,1\}^L$ 是对应的标签向量，L是标签的数量。
$\tau$ 是包含L个节点的层级树
目标是训练一个预测模型 $\zeta$ 以x为输入，输出一个L维的向量 $\bar y\in[0,1]^L$ ，给定阈值以后，将 $\bar y$ 给出最后的输出。

metrics

precision、recall、AUPRC（area under the precision-recall curve）、precison@K、F1@K
介绍几个概念，将会帮助后续量化错误预测的严重性
树上的两个节点 $j,j^{'}\in |L|$ ， $dist(j,j^{'})$ 代表两个节点之间的距离
树上的节点集合 $S\subseteq|L|$ , $\equiv \min_{j^{'}\in S} dist(j,j^{'})$

最低0.47元/天解锁文章

红酒暖心也暖胃

博客等级

码龄8年

77
原创

324
点赞

285
收藏

234
粉丝

关注

私信

热门文章

分类专栏

最新评论

ROPE及各种变体-代码解读
_晴少_: 感谢解惑，参照你的解释确实是这样，我之前的理解是把dim 和 r 搞混了
ROPE及各种变体-代码解读
红酒暖心也暖胃: 对应代码里的demo，max=32，对应的维度是103，前103维都至少转了32圈，是高频部分，保持不变。代码逻辑和论文逻辑是一样的
ROPE及各种变体-代码解读
_晴少_: 你好，请教一个问题，我看到论文里贴的公式和文章里贴的公式都是r<min 的时候插值， r>max 的时候保持; 代码里好像真好相反， r<min的时候高频保持， r>max 的时候低频插值。同时我也看了deepseekv3的代码，和本篇文章里的代码逻辑也是保持一致的。
idea远程连接hive
文科生的编程路: https://www.cnblogs.com/shayue/p/ben-despark-zhi-jie-ji-qun-shang-dehive.html#:~:text=%E6%9C%AC%E5%9C%B0IDEA%E4%B8%AD%E4%BD%BF%E7%94%A8Spark%E7%9B%B4%E8%BF%9E%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%201%20%E8%83%8C%E6%99%AF%20%E6%88%91%E7%94%A8VMWare%E6%90%AD%E5%BB%BA%E4%BA%86%E4%B8%80%E4%B8%AAHadoop%E9%9B%86%E7%BE%A4%EF%BC%8CSpark%E4%B8%8EHive%E7%AD%89%E7%BB%84%E4%BB%B6%E9%83%BD%E5%B7%B2%E7%BB%8F%E5%AE%89%E8%A3%85%E5%AE%8C%E6%AF%95%E3%80%82%20%E7%8E%B0%E5%9C%A8%E6%88%91%E5%B8%8C%E6%9C%9B%E5%9C%A8%E6%88%91%E7%9A%84%E5%BC%80%E5%8F%91%E6%9C%BA%E4%B8%8A%E4%BD%BF%E7%94%A8IDEA%E8%BF%9E%E6%8E%A5%E5%88%B0%E9%9B%86%E7%BE%A4%E4%B8%8A%E7%9A%84Hive%E8%BF%9B%E8%A1%8C%E7%9B%B8%E5%85%B3%E6%93%8D%E4%BD%9C%E3%80%82%202%20%E8%BF%9B%E8%A1%8C%E9%85%8D%E7%BD%AE%E4%BF%AE%E6%94%B9%20%E4%BF%AE%E6%94%B9Hive%E4%B8%AD%E7%9A%84hive-site.xml,%E6%9C%AC%E5%9C%B0IDEA%E4%BD%BF%E7%94%A8%20%E7%A4%BA%E4%BE%8B%E4%BB%A3%E7%A0%81%E5%A6%82%E4%B8%8B%EF%BC%9A%20import%20ml.dmlc.xgboost4j.scala.spark.%20...%204%20pom.xml%20
Simple Contrastive Representation Adversarial Learning for NLP Tasks
weixin_45916750: 有源码吗，感谢

大家在看

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。