【MIML】论文笔记

最新推荐文章于 2023-05-04 19:35:50 发布

咖喱星

最新推荐文章于 2023-05-04 19:35:50 发布

阅读量508

点赞数 1

分类专栏：深度学习

本文链接：https://blog.csdn.net/m0_46651960/article/details/107977234

版权

深度学习专栏收录该内容

10 篇文章 0 订阅

订阅专栏

Multi-instance multi-label learning with application to scene classification.

Z.-H. Zhou and M.-L. Zhang. Multi-instance multi-label learning with application to scene classification. In: Advances in Neural Information Processing Systems 19 (NIPS’06) (Vancouver, Canada), B. Schölkopf, J. C. Platt, and T. Hofmann, eds. Cambridge, MA: MIT Press, 2007, pp.1609-1616.

传统的监督学习

对象由实例（或特征向量）表示并与类标签关联。
$\chi$ ：实例空间（或特征空间）， $\gamma$ ：类标签的集合。
从给定的数据集 $\left \{ ({x_1,y_1}),({x_2,y_2}),...,({x_m,y_m}) \right \}$ 中学习一个函数： $f:\chi \rightarrow \gamma$ 。
其中 $x_1\in \chi$ 是一个实例， $y_1\in \gamma$ 是 $x_1$ 的已知标记。

多实例多标签学习（MIML）

一个训练示例由多个实例描述，并与多个类标签关联。
$\chi$ ：实例空间， $\gamma$ ：类标签的集合。
从给定的数据集 $\left \{ ({X_1,Y_1}),({X_2,Y_2}),...,({X_m,Y_m}) \right \}$ 中学习一个函数： $f_{MIML}:2^\chi→2^\gamma$ 。
其中 $X_i\subseteq \chi$ 是一个集合实例 $\left \{x _{1}^{(i)},x _{2}^{(i)},...,x _{n_{i}}^{(i)} \right \},x_{j}^{(i)}\in \chi (j=1,2,...,n_{i})$ ， $Y_i\subseteq \gamma$ 是一组标签 $\left \{y _{1}^{(i)},y _{2}^{(i)},...,y _{l_{i}}^{(i)} \right \},y_{k}^{(i)}\in \gamma(k=1,2,...,l_{i})$ 。
这里用 $n_i$ 表示实例数 $\chi_i$ ，用 $l_i$ 表示标签数 $Y_i$ 。

多实例学习（MIL）

研究了由多个实例描述的真实对象与一个类标签相关联的问题。
从给定的数据集 $\left \{ ({X_1,y_1}),({X_2,y_2}),...,({X_m,y_m}) \right \}$ 中学习函数： $f_{MIL}:2^\chi \rightarrow \left \{ -1,+1 \right \}$ 。
其中 $_i\subseteq \chi$ 是一组实例 $\left \{x _{1}^{(i)},x _{2}^{(i)},...,x _{n_{i}}^{(i)} \right \},x_{j}^{(i)}\in \chi (j=1,2,...,n_{i})$ ， $y_i \in\left \{ -1,+1 \right \}$ 是 $X_i$ 的二进制标签。

多标签学习（MLL）

研究了一个实例描述的现实世界对象与多个类标签相关联的问题。
从给定的数据集 $\left \{ ({x_1,Y_1}),({x_2,Y_2}),...,({x_m,Y_m}) \right \}$ 中学习函数： $f_{MLL}:\chi \rightarrow 2^\gamma$ 。
其中 $\chi _i\subseteq \chi$ 是一个实例， $Y_i\subseteq \gamma$ 是一组标签 $\left \{y _{1}^{(i)},y _{2}^{(i)},...,y _{l_{i}}^{(i)} \right \},y_{k}^{(i)}\in \gamma (k=1,2,...,l_{i})$ 。

总结

多实例学习研究输入空间（或实例空间）中的歧义，其中对象具有许多替代输入描述，即实例；
多标签学习研究输出空间（或标签空间）中的歧义，其中对象具有许多替代输出描述，即标签；
MIML同时考虑输入和输出空间中的歧义；

使用多实例学习或多标签学习作为桥梁，通过在传统的监督学习框架中确定MIML的等效性。

方案一：使用多实例学习作为桥梁。

将MIML学习任务（即学习功能 $f_{MIML}:2^\chi→2^\gamma$ ）转换为多实例学习（即学习功能 $f_{MIL}:2^\chi ×\gamma\rightarrow \left \{ -1,+1 \right \}$ ）。
对于任何 $y\in\gamma$ ，如果 $y\in Y_i$ ，则 $f_{MIL}(X_i,y)=+1$ ，否则为-1。可以根据 $Y^*=\left \{ y|arg_{y\in\gamma} [f_{MIL}(X^*,y)=+1 ]\right \}$ 确定新示例 $X^*$ 的适当标签。
将此多实例学习任务进一步转换为传统的有监督学习任务，即在指定如何从 $f_{SISL}\left ( x_{j}^{(i)},y \right )\left ( j=1,...n_i \right )$ 导出 $f_{MIL}\left ( X_i,y \right )$ 的约束下学习函数 $f_{SISL}:\chi \times \gamma\rightarrow \left \{ -1,+1 \right \}$ 。对于任何 $y\in\gamma$ ， $f_{SISL}\left ( x_{j}^{(i)},y \right )=+1$ ，否则为-1。这里的约束条件可以是 $f_{MIL}\left ( X_i,y \right )= sign\left [ \sum _{j=1}^{n_i}f_{SISL}\left ( x_j^{(i)} ,y\right )\right ]$ ，此条件已用于将多实例学习任务转换为传统的有监督学习任务。这里也可以用其他类型的约束。
SISL：Single-instance single-label learning

方案二：使用多标签学习作为桥梁。

将MIML学习任务（即学习功能 $f_{MIML}:2^\chi→2^\gamma$ ）转换为多标签学习任务（即学习功能 $f_{MLL}:Z\rightarrow 2^{\gamma}$ ）。
对于任何 $z_{i}\in Z$ ，如果 $z_{i}= \phi \left ( X_{i} \right ),\phi :2^{\chi }\rightarrow Z$ ，则 $f_{MLL}\left ( z_{i} \right )=f_{MIML}\left ( X_{i} \right )$ 。可以根据 $Y^{*}= f_{MLL}\left ( \phi \left ( X^{*} \right ) \right )$ 确定新示例 $X^*$ 的适当标签。
可以将多标签学习任务进一步转换为传统的有监督学习任务，即学习函数 $f_{SISL}:Z\times \gamma \rightarrow \left \{ -1,+1 \right \}$ 。对于任何 $y\in\gamma$ ，如果 $y\in Y_i$ ，则 $f_{SISL}\left ( z_{i},y \right )=+1$ ，否则为-1。也就是说 $f_{MLL}\left ( z_{i} \right )= \left \{ y|arg_{y\in\gamma}[f_{SISL}\left ( z_{i},y \right )=+1] \right \}$ 。
这里的映射可以通过构造聚类来实现，该聚类已用于将多实例包转换为传统的单实例。这里也可以用其他类型的映射。

算法：MIML BOOST（对应方案一）

前提定义：
- 给定任何集合 $\Omega$ ，让 $|\Omega|$ 表示其大小，即 $\Omega$ 中的元素数；
- 给定任何谓词 $\pi$ ，如果 $\pi$ 成立，则 $[[\pi]]$ 为1，否则为0；
- 给定 $\left ( X_{i},Y_{i} \right)$ ，对于任何 $y\in Y$ ，如果 $y\in Y_i$ ，则令 $\Psi \left ( X_{i},y \right )=+1$ ，否则为-1，其中 $\Psi$ 是函数 $\Psi :2^{\chi }\times \gamma \rightarrow \left \{ -1,+1 \right \}$ 。表1为MIML BOOST算法。
第一步，将每个MIML示例 $\left ( X_{u},Y_{u} \right )\left ( u=1,2,...,m \right )$ 转换为多实例袋的数量 $\left | \gamma \right |$ 集合。
- 即 $\left \{ \left [ \left ( X_{u},y_{1} \right ),\Psi \left ( X_{u},y_{1} \right ) \right ] , \left[ \left ( X_{u},y_{2} \right ),\Psi \left ( X_{u},y_{2} \right ) \right ] ,...,\left[ \left ( X_{u},y_{\left | \gamma \right |} \right ),\Psi \left ( X_{u},y_{\left | \gamma \right |} \right ) \right ]\right \}$ 。
- 注意， $\left [ \left ( X_{u},y_{v} \right ),\Psi \left ( X_{u},y_{v} \right ) \right ]\left ( v=1,2,...,\left | \gamma \right | \right )$ 是标记的多实例袋，其中 $\left ( X_{u},y_{v} \right )$ 是包含实例数量为 $n_u$ 的袋，即 $\left \{ \left ( x_{1}^{\left ( u \right )},y_{v} \right ) ,\left ( x_{2}^{\left ( u \right )},y_{v} \right ),...,\left ( x_{n_u}^{\left ( u \right )},y_{v} \right )\right \}$ ， $\Psi \left ( X_{u},y_{v} \right )\in \left \{ +1,-1 \right \}$ 是这个袋子的标签。
因此，原始MIML数据集将转换为一个多实例数据集，包含袋数 $m\times \left | \gamma \right |$ ，即 $\left \{ \left [ \left ( X_1,y_1 \right ),\Psi \left ( X_1,y_1 \right ) \right ],...,\left [ \left ( X_1,y_{|\gamma|} \right ),\Psi \left ( X_1,y_{|\gamma|} \right ) \right ], \left [ \left ( X_2,y_1 \right ),\Psi \left ( X_2,y_1 \right ) \right ],...,\left [ \left ( X_m,y_{|\gamma|} \right ),\Psi \left ( X_m,y_{|\gamma|} \right ) \right ] \right \}$ 。令 $\left [ \left ( X^{\left ( i \right )} ,y^{\left ( i \right )} \right ),\Psi \left ( X^{\left ( i \right )} ,y^{\left ( i \right )} \right ) \right ]$ 表示袋数 $m\times \left | \gamma \right |$ 中的第 $i$ 个，即 $\left ( X^{\left ( 1 \right )},y^{\left ( 1 \right )} \right )$ 表示 $\left ( X_1,y_1 \right ),...,\left ( X^{\left ( \left | \gamma \right | \right )},y^{\left ( \left | \gamma \right | \right )} \right )$ ，表示 $\left ( X_1,y_{\left | \gamma \right |}\right ),...,\left ( X^{\left ( m\times \left | \gamma \right | \right )} ,y^{\left ( m\times \left | \gamma \right | \right )} \right )$ ，表示 $\left ( X_m,y_{\left | \gamma \right |} \right )$ ，其中 $\left ( X^{\left ( i \right )} ,y^{\left ( i \right )}\right )$ 包含 $n_i$ 个实例数，即 $\left \{ \left ( \boldsymbol{x}_{1}^{\left ( i \right )},y^{\left ( i \right )} \right ),\left ( \boldsymbol{x}_{2}^{\left ( i \right )},y^{\left ( i \right )} \right ) ,...,\left ( \boldsymbol{x}_{n_i}^{\left ( i \right )},y^{\left ( i \right )} \right )\right \}$ 。
然后，可以从数据集中学习多实例学习函数 $f_{MIL}$ ，因为 $f_{MIML}\left ( X^* \right )= \left \{ y|arg_{y\in \gamma}\left (sign[f_{MIL}\left ( X^* \right ),y]= +1 \right ) \right \}$ 。在这里，我们使用MIBOOSTING实现 $f_{MIL}$ 。
【未完待续】

M3MIML: A maximum margin method for multi-instance multi-label learning.

M.-L. Zhang and Z.-H. Zhou. M3MIML: A maximum margin method for multi-instance multi-label learning. In: Proceedings of the 8th IEEE International Conference on Data Mining (ICDM’08), Pisa, Italy, 2008, pp.688-697.

针对MIML的最大余量方法，该方法直接利用了实例与标签之间的联系。
在图像分类中，一个图像通常包含几个自然分区的补丁（patch），每个补丁都可以表示为一个实例，而这样的图像可以同时对应于多个语义类别，例如云，草地和狮子。

$M^3MIML$ 算法

$M^3MIML$ ：多实例多标签的最大边距法。为每个类别都假设一个线性模型，其中一个类别的输出设置为相对于相应的线性模型，所有MIML示例的实例的最大预测。随后，将所有可能类的输出组合在一起，以定义分类系统上MIML示例的边距。显然，每个实例都涉及确定每个可能类的输出，并且在组合阶段还解决了不同类之间的相关性。因此， $M^3MIML$ 显式利用了实例和MIML示例的标签之间的连接。

Primal form

给定一个MIML训练示例 $\left ( X_{i},Y_{i} \right )$ ，让 $\vec{Y_i}$ 表示 $X_i$ 的类别向量，如果 $l\in Y_{i}$ ，则第 $l$ 个分量 $\vec{Y_i}(l)$ 等于1，否则为-1。假设分类系统由 $Q$ 个线性模型 $\left \{ \left ( \boldsymbol w_{l},b_l \right ) | l\in\gamma\right \}$ 组成，每个线性模型对应于一个可能的类别标签。其中， $w_l\in \mathbb{R}^{d}$ 是第 $l$ 的权重向量，而 $b_l\in \mathbb{R}$ 是相应的偏差。
$M^3MIML$ 假设系统在第 $l$ 类上针对 $\left ( X_{i},Y_{i} \right )$ 的系统输出由 $X_i$ 对 $\left ( \boldsymbol w_{l},b_l \right )$ 实例的最大预测确定。对于看不见的袋子 $X\in\chi$ ，其相关标签集可通过以下方式确定：
$Y=\left \{ l|\underset{x\in X}{max}\left ( \left \langle \boldsymbol w_{l},\boldsymbol x \right \rangle +b_l \right )\geq 0,l\in \gamma \right \}$
基于输出，我们将第 $l$ 类的 $\left ( X_{i},Y_{i} \right )$ 的边距定义为：
$\frac{\vec{Y_i}\cdot \underset{x\in X_i}{max}\left ( \left \langle \boldsymbol w_{l},\boldsymbol x \right \rangle +b_l \right)}{\left \| \boldsymbol w_l \right \|}$
其中， $\left \langle \cdot ,\cdot \right \rangle$ 计算两个向量之间的点积， $\left \| \cdot \right \|$ 表示向量范数。相对于分类系统 $\left ( X_{i},Y_{i} \right )$ 的边距设置为所有类别上 $\left ( X_{i},Y_{i} \right )$ 的最小边距：
$\underset{l\in\gamma}{min}\frac{\vec{Y_i}\cdot \underset{x\in X_i}{max}\left ( \left \langle \boldsymbol w_{l},\boldsymbol x \right \rangle +b_l \right)}{\left \| \boldsymbol w_l \right \|}$

咖喱星

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
【MIML】论文笔记

Multi-instance multi-label learning with application to scene classification. 传统的监督学习对象由实例（或特征向量）表示并与类标签关联。χ\chiχ：实例空间（或特征空间），YYY：类标签的集合。从给定的数据集{(x1,y1),(x2,y2),...,(xm,ym)}\left \{ ({x_1,y_1}),({x_2,y_2}),...,({x_m,y_m}) \right \}{(x1,y1),(x2,y2),
复制链接

扫一扫