Scalable Algorithms for Multi-Instance Learning

最新推荐文章于 2024-09-14 22:25:23 发布

还在写BUG呢

最新推荐文章于 2024-09-14 22:25:23 发布

阅读量346

点赞数

分类专栏：多示例学习文章标签：算法聚类

本文链接：https://blog.csdn.net/Knight_ZJY/article/details/128206501

版权

多示例学习专栏收录该内容

19 篇文章 2 订阅

订阅专栏

Scalable Algorithms for Multi-Instance Learning

多示例学习的可扩展算法

时间：2022/12/6

文章目录

Scalable Algorithms for Multi-Instance Learning

bib

@article{wei2016scalable,
  title={Scalable algorithms for multi-instance learning},
  author={Wei, Xiu-Shen and Wu, Jianxin and Zhou, Zhi-Hua},
  journal={IEEE transactions on neural networks and learning systems},
  volume={28},
  number={4},
  pages={975--987},
  year={2016},
  publisher={IEEE}
}

主要贡献

为了解决大规模的MIL问题，提出了基于局部聚合描述子表示向量的MIL和基于Fisher向量表示的miFV两种高效可扩展的MIL算法。

miVLAD和miFV由于映射步骤的计算成本低，线性分类器的可扩展性强，能够高效、有效地处理大规模MIL数据。实验表明，miVLAD和miFV不仅与最先进的MIL算法具有相当的准确率，而且速度快了数百倍。

可以将新的miVLAD和miFV表示视为多视图数据，这在大多数情况下提高了准确率。

主要内容

VLAD表示和FV表示是计算机视觉中的两种方法。给定一幅图像和一组从该图像中提取的描述符(向量)(例如，SIFT)， VLAD或FV将它们编码为高维向量，这就是新的图像级签名。

一、miVLAD

1.主要思想

首先从整个训练集实例空间中寻找K个向量，即“描述符”。文章所采用的方法是对训练实例空间进行K-means聚类，选取K个簇中心来作为描述符即 $C=\{c_1,...c_k,...,c_K\}$ ,这里作者将 $C$ 称作codebook,即“密码本”。如同传统密码学中的加解密的依据，这里也将这个 $C$ 作为之后编码的基础依据。而由于每一个聚类中心 $c_i$ 都是隶属于一个簇，则在这个簇内的实例 $x_{ij}$ (第i个包的第j个实例)都是隶属于这个簇中心 $c_i$ ,则记录每个实例与其簇中心/描述符的对应关系 $c_k=NN(x_{ij})$ 。

之后通过如算法2所示映射函数将一个包 $X_i$ 转换成一个向量 $v_i$ ，具体来说则是通过如下公式进行差值计算：

$v_{ikl}=\sum_{x_{ij}\in\Omega}x_{ijl}-c_{kl} \tag{1}$

$\Omega=\{x_{ij}|NN(x_{ij})=c_k\}$ ，这里 $v_i$ 的维度为D=K x d。 $v_{ikl}$ 表示 $v_i$ 的第k个分量的第 $l$ 个属性， $x_{ijl}$ 和 $c_{kl}$ 分别表示实例 $x_{ij}$ 及其对应质心 $c_k$ 的第 $l$ 个属性。其中，vi中的每个元素都是$v_{il}\leftarrow sign(v_{il}) \sqrt{|v_{il}|} $。然后，将新的特征向量 v i 通过$ v_i←v_i /{||v_i||}^2$ 归一化。最终包便转换成特征向量。