【论文阅读】Multi-instance Ensemble Learning with Discriminative Bags

最新推荐文章于 2024-07-16 21:58:58 发布

还在写BUG呢

最新推荐文章于 2024-07-16 21:58:58 发布

阅读量323

点赞数

分类专栏：多示例学习文章标签：机器学习算法人工智能

本文链接：https://blog.csdn.net/Knight_ZJY/article/details/126252282

版权

多示例学习专栏收录该内容

19 篇文章 2 订阅

订阅专栏

【论文阅读】Multi-instance Ensemble Learning with Discriminative Bags

时间：2022/8/9

文章目录

【论文阅读】Multi-instance Ensemble Learning with Discriminative Bags

1.摘要

多实例学习(MIL)比传统的监督学习更具一般性和挑战性，因为标签是在包级给出的。常用的特征映射方法是将每个包转化为新特征空间中的一个实例。但是，它们大多很难维持包的可分辨性，MIL模型不支持自我强化。

在本文中，我们提出了一种基于判别包的多实例集成学习(ELDB)算法。包选择技术根据两部分得到区别性包集(dBagSet)。首先，考虑数据的空间分布和标签分布，通过判别分析优化包选择过程，得到基本的dBagSet。其次，利用状态和动作的转移策略，通过自强化得到一个可区分性较好的dBagSet;集成技术用这些dbagset训练一系列分类器，得到最终的加权模型。实验结果表明，该方法优于目前最先进的MIL映射方法。

2.主要贡献

1.提出一种基于包辨别性分析的包选择技术。

2.提出一种基于包辨别性的自我强化算法，使得MIL模型支持自我强化。

3.提出一种MIL的集成学习算法。

3.符号系统

符号	含义
$\tau$	原始数据集
$\tau_d\subset \tau$	基础数据集
$\tau_s=\tau/\tau_d$	更新数据集
$\tau_e \subset \tau$	具有辨别性包的数据集（dBagSet）
$Y=[y_1,...,y_N]$	标签向量
$B_i=\{x_{ij}\}_{j=1}^{n_i}$	原始数据集中的第i个包
$x_{ij}$	第i个包的第j个实例
$y_i$	第i个包的标签
$N$	原始数据集的大小
$\psi$	辨别包数据集大小
$n_i$	第i个包的大小
$b_i$	第i个包的映射向量

4.算法描述

4.1包映射函数

$B_i\in \tau$ 通过如下映射函数映射到新的特征空间里：

$f_b(B_i,\tau_e)\mapsto b_i=[b_{i\zeta_1},...,b_{i\zeta_\psi}]\tag{1}$

其中 $b_{i\zeta_k}$ 为 $B_i与B_{\zeta_k}$ 的相关值，这里选取的是平均 Hausdorff距离。

$b_{ik}=||\overline x_i-\overline x_k||\tag{2}$

通过该映射函数，将数据集转换成新的向量集。

$f_m(\tau,\tau_e)\mapsto V=\{b_i\}_{i=1}^N\tag{3}$

4.2ELDB总体框架

在这里插入图片描述

如图所示便是ELDB的总体框架，为了提高MIL单模型的分类性能和稳定性，我们将数据集T随机分为基本数据集 $\tau_d = \{b_{\zeta_i}\}_{i=1}^{ N_d}$ 和更新数据集 $\tau_s = \{b_{\zeta_i}\}_{i=N_d+1}^N$ ，其中 $1≤ξ_i≤n$ ，然后通过两个关键技术学习加权集成模型。

首先，使用两部分的包选择技术初始化dBagSet $\tau _e\subset \tau$ 。一部分是判别分析。通过考虑Td的空间分布和标签分布，我们得到了判别矩阵L和基本dBagSet $\tau_e^0$ 。另一部分是自我强化机制。对于 $\tau_s$ 的子集，采用自增强机制来判断dBagSet是否可以更新。通过这样，我们可以获得高判别性的数据集。

其次，集成技术根据SIL分类器 $f_c(···)$ 和指定的映射函数集成这些dBagSet。其步骤为：a)基础数据集和更新数据集分别映射为单实例 $V_d^i$ 和 $V_s^i$ 的集合；b)单实例模型 $M_i$ 使用 $V_d^i$ 和标签向量 $[y_{\zeta_1},...,y_{\zeta_{N_d}}]$ 进行训练；c)根据 $Mi和V_s^i$ 计算模型权重 $w_i$ 。最后，对dBagSets、模型和权重进行集成，得到加权集成模型。

4.3包选择技术

一.辨别分析技术

通过改写MILDM的实例评估标准，即最大化不同类标记实例的距离，最小化相同类标记实例的距离，设 $d_{ij}=d(f_b(B_{\zeta_i},\tau_e),f_b(B_{\zeta_j},\tau_e))$ 表示两个包之间的距离,则：

$\max_{\tau_e \subseteq\tau_d\subset\tau}\sum_{y_{\zeta_i}\ne y_{\zeta_j}}d_{ij}\tag{4}$

$\max_{\tau_e \subseteq\tau_d\subset\tau}\sum_{y_{\zeta_i}= y_{\zeta_j}}d_{ij}\tag{5}$

为将多目标优化转化为单目标优化，引入bag-link矩阵 $\Delta= [\delta_{ij}]_{N_d×N_d}$ ，其中:

$\delta_{ij}= \begin{cases} \lambda_{ij},&y_{\xi_i}\ne y_{\xi_j}\\ -\lambda_{ij},&y_{\xi_i}=y_{\xi_j} \end{cases}\tag{6}$

其中 $\lambda_{ij}>0$ 是一个超参，后面会设置为1.

这样，我们便得到了优化目标：

$\max_{\tau_e\subseteq \tau_d\subset\tau}J(\tau_d,\tau_e)={1\over2}\sum_{B_{\xi_i},B_{\xi_j}\in\tau_d}d_{ij}\delta_{ij}\tag{7}$

为了快速选择出dBagSet，我们引入对角包选择矩阵 $Q=[q_{ij}]_{N_d×N_d}$ ，和对角线矩阵 $\Gamma=[\gamma_{ij}]_{N_d×N_d}$ 其中 $\gamma_{ij}=\sum_j\delta_{ij}$

其中如果i=j同时 $B_{\xi_i}\in\tau_e,q_{ij}=1$ ,其他情况 $q_{ij}=0$ 。则将包的距离公式改为：

$d_{ij}=||Qb_{\xi_i}^*-Qb_{\xi_j}^*||^2 \tag{8}$

将优化目标调整为

$J(\tau_d,\tau_e)=\sum_{B_{\xi_k}\in\tau_e}b_{\xi_k}^*L(b_{\xi_k}^*)^T\tag{9}$

令

$p_k=b_{\xi_k}^*L(b_{\xi_k}^*)^T\tag{10}$

$p_k$ 即为包的辨别优先级。将优化目标调整:

$\max_{\tau_e\subseteq \tau_d\subset\tau}\sum_{B_{\xi_k}\in\tau_e}p_{\xi_k}\tag{11}$

则最终的初始dBagSet便选取优先级最高的前 $\psi$ 个组成:

$\tau_e=bagSelection(\tau_d,\psi)\tag{12}$

在初始化时基础包的选择方案有四种：

Global(g) ：使用数据集所有包来生成dBagSet
Positive §：使用所有正包
Negative (n)：使用所有负包
Balance (b)：选择等量的正面和负面辨别包

二，自增强机制

在这里插入图片描述

每次更新使用更新数据集 $\tau_s$ 的子集对基础数据集 $\tau_e^0$ 进行更新。使用更新子集 $\tau_s^i$ 中判别优先级最高的包与 $\tau_e$ 中判别优先级最低的包进行对比，若有新的更高优先级的包出现。则策略”a“：将新的包加入 $\tau_e$ 中；策略"r":使用新的包替换掉 $\tau_e$ 中优先级最小的包。

4.4集成技术

通过集成技术可以根据 $\tau_e$ 的每次更新的信息进行预测可以考虑到更多的信息，降低完全依赖单一模型的不确定性。

对于单个单实例分类器，使用训练数据训练模型：

$M=f_c^{model}(V_d^i,Y_d^i)\tag{13}$

使用更新数据测试分类器性能：

$w=f_c^{weight}(V_s^i,Y_s^i,M)\tag{14}$

进行预测：

$\hat y_i=f_c^{predict}(b_i,M)\tag{15}$

加权集成模型： $\Mu \leftarrow\Mu\cup (M_i,w_i,T_e^i)$

则包的预测标签：

$y^*=sign(\sum_jw_jY_{ij})\tag{16}$

ag{14}
$$