无消歧的偏标记学习（2017）

最新推荐文章于 2024-06-05 10:12:10 发布

fan2312

最新推荐文章于 2024-06-05 10:12:10 发布

阅读量1.1k

点赞数 1

分类专栏：偏标记文章标签：无消歧偏标记

本文链接：https://blog.csdn.net/fan2312/article/details/100055651

版权

本文探讨了在偏标记学习场景中，由于无法直接获取真值标签，传统的多分类策略如一对余、一对一分解不适用。提出了一种名为PL-ECOC的方法，它利用ECOC框架，通过特定的编码和解码阶段，解决无消歧的偏标记学习问题。在编码阶段，根据候选标签集构建二分类器；解码阶段则基于二分类器的性能预测样本类别。未来的研究方向包括非随机编码和其他无消歧策略。

摘要由CSDN通过智能技术生成

原文链接：http://aaai.org/ocs/index.php/AAAI/AAAI17/paper/view/14210

研究动机

基于消歧的策略易于被和真值标签在样本候选标签集中同时出现的假阳性标签误导而性能下降，候选集越大，性能下降越多
多分类器分解为二分类器
- 多分类器集成的最流行机制是使用一对余或一对一分解将学习任务分解
  - 一对余分解：学习任务分解为多个二分类器。对每个二分类器：一个类为正类，其余类都为负类。将二分类器的输出作为类标签的预测置信度，通过选择输出最大的分类器的类标签作为对未见过样本的预测
  - 一对一分解：学习任务分解为 $\begin{bmatrix} q \\ 2\end{bmatrix}$ 个二分类器，每个二分类器分类一对类标签 $(y_j,y_k)(1 \le j <k \le q),y_j$ 为正类， $y_k$ 为负类。通过将二分类器的输出作为类标签上的投票，通过选择从所有二分类器中获得最大票数的类标签作为对未见样本的预测。
- 在偏标记学习场景中，因为训练样本的真值标签不能直接访问（不知道是哪个是真值）。不能使用一对余、一对一分解，因为不知道样本属于哪一类。

Evidently, the major difficulty for partial label learning lies in that the ground-truth label of the PL training example is concealed in its candidate label set and thus not directly accessible to the learning algorithm.

定义

d维样本空间： $X=\mathbb{R}^d$
含q个类标签的标签空间： $Y={y_1, y_2,...,y_q}$
含m个样本的训练集： $D=\{(x_i,S_i)|1\le i \le m\}$
每个样本 $x_i$ 由d维特征向量表示： $x_{i1},x_{i2},...,x_{id})^T$

最低0.47元/天解锁文章

fan2312

关注

1
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
无消歧的偏标记学习（2017）

原文链接：http://aaai.org/ocs/index.php/AAAI/AAAI17/paper/view/14210研究动机基于消歧的策略易于被和真值标签在样本候选标签集中同时出现的假阳性标签误导而性能下降，候选集越大，性能下降越多多分类器分解为二分类器多分类器集成的最流行机制是使用一对余或一对一分解将学习任务分解一对余分解：学习任务分解为多个二分类器。对每个二分类器：一...
复制链接

扫一扫