论文笔记: 多标签学习 BP-MLL

闵帆

已于 2022-06-27 07:51:45 修改

阅读量661

点赞数 1

分类专栏：论文笔记文章标签：机器学习深度学习神经网络

于 2022-06-12 11:38:50 首次发布

本文链接：https://blog.csdn.net/minfanphd/article/details/125243160

版权

论文笔记专栏收录该内容

29 篇文章 3 订阅

订阅专栏

摘要: 分享对论文的理解. 原文见 Zhang, M.-L., & Zhou, Z.-H. (2006). Multi-label neural networks with applications to functional genomics and text categorization. IEEE Transactions on Knowledge and Data Engineering, 18, 1338–1351.

1. 论文贡献

The first multilabel neural network algorithm.
多标签学习的第一个神经网络算法.

2. 主要思想

The labels belonging to an instance should be ranked higher than those not belonging to that instance.
例: 如果图片里面有猫但没狗, 则猫对应的预测值应该比狗的大.
更实际的例子: 对猫这个标签的预测值为 0.6, 对狗为 0.3, 则惩罚较小 (机器学习里面一般惩罚值都大于 0); 否则惩罚很大.
进一步解读: 成对的比较.

3. 符号系统

符号	含义	说明
$\mathcal{X} = \mathbb{R}^d$	$d$ 维特征空间
$\mathcal{Y} = \{1, 2, \dots, Q\}$	标签空间	使用整数集合而不是 ${-1, 1\}^d$
$\mathcal{X} \to 2^\mathcal{Y}$	分类器	使用幂集
$\mathcal{X} \times \mathcal{Y} \to \mathbb{R}$	回归器	为每个对象的每个标签预测一个概率

说明:

从回归器到分类器, 只需要增加一个阈值.
有些 (更为流行的) MLL 评价指标并不需要输出 $+ 1$ 或 $- 1$ , 而是标签的排序.

4. 算法核心

图 1. 神经网络结构

$\sum_{i=1}^m E_i = \sum_{i=1}^m \frac{1}{\vert Y_i \vert \vert \overline{Y_i} \vert} \sum_{(k, l) \in Y_i \times \overline{Y_i}} \exp(-(c_k^i - c_l^i)), \tag{1}$
其中:

$\overline{Y_i} = \mathcal{Y} \setminus Y_i$ , 即 $Y_i$ 的补集.
$c_k^i = f(\mathbf{x_i}, k)$ 是神经网络对于 $\mathbf{x_i}$ 第 $k$ 个标签的预测值.
第一个求和是针对所有对象.
第二个求和本质上是双重循环, 如 $\vert Y_i \vert = 10$ , $Q = 100$ , 则需要求 $10 \times 90 = 900$ 对.
当 $\exp$ 的参数小于 0 时, 损失较小, 否则相当大.