论文阅读(七)：Dual-stream Maximum Self-attention Multi-instance Learning （DMSMIL）

最新推荐文章于 2023-04-19 09:56:54 发布

天不生我喜哥

最新推荐文章于 2023-04-19 09:56:54 发布

阅读量420

点赞数 4

分类专栏：论文阅读文章标签：神经网络机器学习

本文链接：https://blog.csdn.net/qq_39443703/article/details/115770183

版权

论文阅读专栏收录该内容

20 篇文章 3 订阅

订阅专栏

文章目录

引入
前言
方法
- 问题表述
- 双流MIL聚合

引入

很久没有看论文和写博客，现在把最近看的一篇多示例学习（MIL）的论文解读一下，希望有所收获。

前言

该篇论文提出了一种由神经网络参数化的双流最大自注意的MIL模型（DSMIL）；
主要步骤：1）第一流部署了一个简单的 MIL max-pooling，并确定了top激活的嵌入实例；2）在第二个流中，通过仅将顶部激活的查询与包中的实例相关联，跨实例计算注意力得分。
特点：基于相同的实例嵌入来训练一个实例分类器和包分类器。

方法

问题表述

包： $B=(x_1,y_1), \cdots, (x_n,y_n)$ ；实例： $x_i \in X$ ；实例标签： $y_i\in 0,1$
包的标签： $c(B)=1-\prod \limits_{i=1}^n{(1-y_i)}$ ；
假设有一些合适的变换 $f$ 和 $g$ ，则 $c(B)=g(f(x_0),\cdots,f(x_n))$ 。
关于函数 $f$ 和 $g$ ，MIL有两种模型处理方式：1）基于实例的方法： $f$ 是实例级别的分类器，它为每个实例生成一个类别评分， $g$ 是一个池化运算符，用于汇总实例评分以生成袋评分；2）基于嵌入的方法： $f$ 是实例级特征提取器，将每个实例映射到一个嵌入， $g$ 是一个聚合函数，它首先将所有实例嵌入映射到一个包嵌入，并根据该包嵌入生成一个包得分。

双流MIL聚合

$\mathbf{H}=\left[\mathbf{h}_{0}, \ldots, \mathbf{h}_{N-1}\right] \in \mathbb{R}^{L \times N}$ 是嵌入实例的包，其中 $\mathbf{h}_i$ 是第 $i$ 个实例的嵌入。
第一个流是一个具有 MIL max-pooling 的实例级别分类器:
$\mathbf{c}_{m}=\max \left\{\mathbf{W}_{0} \mathbf{h}_{0}, \ldots, \mathbf{W}_{0} \mathbf{h}_{N-1}\right\}$ 其中， $\mathbf{W}_0$ 是一个全连接层的权值矩阵。
第二个流从嵌入实例学习到嵌入包，并且学习包分类器给嵌入包打分。
步骤1）：通过第一流得到最优激活嵌入实例 $\mathbf{h}_m$ ，然后将嵌入实例转换成两个向量：查询向量 $\mathbf{q}_i\in \mathbb{R}^{L \times 1}$ 和信息向量 $\mathbf{v}_i \in \mathbb{R}^{L \times 1}$ ,
$\mathbf{q}_{i}=\mathbf{W}_{q} \mathbf{h}_{i}, \quad \mathbf{v}_{i}=\mathbf{W}_{v} \mathbf{h}_{i}, \quad i=0, \ldots, N-1$ , 其中 $\mathbf{W}_q$ 和 $\mathbf{W}_v$ 是两个全连接层的权值矩阵。
步骤2）：最大自注意力向量的每一个属性 $a_i$ :
$a_{i}=\frac{\exp \left(\mathrm{s}_{i}\right)}{\sum_{i=0}^{N-1} \exp \left(\mathrm{s}_{i}\right)}, \quad s_{i}=\left\langle\mathbf{q}_{i}, \mathbf{q}_{m}\right\rangle, \quad i=0, \ldots, N-1$
步骤3）：嵌入包 $\mathbf{b} \in \mathbb{R}^{L \times 1}$ :
$\mathbf{b}=\sum_{i} a_{i} \mathbf{v}_{i}$ 其中，求和的操作是对每个元素都求和。
步骤4）：包的得分 $\mathbf{c}\in \mathbb{R}^{L \times 1}$ :
$\mathbf{c}_{b}=\mathbf{W}_{1} \mathbf{b}$ ， $\mathbf{W}_1$ 是一个全连接层的权值矩阵。
步骤5）：最后包的得分是两个流得分的权值和：
$\hat{\mathbf{c}}=(1-\lambda) \mathbf{c}_{m}+\lambda \mathbf{c}_{b}, \quad \lambda \in[0,1]$

天不生我喜哥

关注

4
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
论文阅读(七)：Dual-stream Maximum Self-attention Multi-instance Learning （DMSMIL）

文章目录引入前言方法问题表述双流MIL聚合引入很久没有看论文和写博客，现在把最近看的一篇多示例学习（MIL）的论文解读一下，希望有所收获。前言该篇论文提出了一种由神经网络参数化的双流最大自注意的MIL模型（DSMIL）；主要步骤：1）第一流部署了一个简单的 MIL max-pooling，并确定了top激活的嵌入实例；2）在第二个流中，通过仅将顶部激活的查询与包中的实例相关联，跨实例计算注意力得分。特点：基于相同的实例嵌入来训练一个实例分类器和包分类器。方法问题表述包：
复制链接

扫一扫