论文阅读 (十四)：Ensemble Transfer Learning Algorithm (2018TrResampling)

最新推荐文章于 2024-12-02 10:38:40 发布

因吉

最新推荐文章于 2024-12-02 10:38:40 发布

阅读量567

点赞数 2

分类专栏： # 更多的学习文章标签：论文阅读迁移学习集成学习 FanSmale 因吉

本文链接：https://blog.csdn.net/weixin_44575152/article/details/108975566

版权

更多的学习专栏收录该内容

18 篇文章

订阅专栏

文章目录

引入
1 TrResampling
2 集成迁移学习
- 2.1 Bagging-Based
- 2.2 MultiBoosting-Based

引入

论文地址：https://ieeexplore.ieee.org/document/8194845
摘要要点：
1）迁移学习和集成学习是解决训练数据与测试数据分布不同的新趋势。
2）本文设计了当训练数据不充分时的集成迁移学习框架，以提高分类精度：
2.1）提出用于迁移学习的加权重采样方法，命名为TrResampling。在每次迭代中，对source domain中权重较大的数据进行重采样，并使用TrAdaBoost来调整source data和target data之间的权重；
2.2）使用Baywa、decision tree和SVM作为基学习器，并使用最佳性能的学习器来进行迁移学习。

1 TrResampling

通过以下两个伪代码，可以对该算法有一个大致的了解：

算法1：权重重采样Weighted-Resampling (WR) 框架
输入：
大小为 $N$ 的训练集 $D$
1：随机生成训练集权重 $w_i$
2：创建一个与 $D$ 等大小的新数据集 $D^{'}$
3：为 $D$ 中的每一个样本生成一个采样概率 $p_i$
4：for $i = 1$ to $N$ do
5： if $\sum_{j = 1}^{j = i} p_j <= \sum_{j = 1}^{j = i} w_i$ then
6：添加 $D$ 中第 $i$ 个样本至 $D^{'}$
7： end if
8：end for
输出：重采样数据集 $D^{'}$

算法2：TrResampling框架
输入：
大小为 $N$ 的训练集 $D$ 、大小为 $m$ 的源数据 $D_S = \{ (x_1^S, y_1^S), \cdots, (x_m^S, y_m^S) \}$ 和大小为 $n$ 的目标数据 $D_T = \{ (x_1^T, y_1^T), \cdots, (x_n^T, y_n^T) \}$ 、基学习器BaseLearner (BL) 例如TrAdaBoost ( $D_S$ 和 $D_T$ 来自同一实例空间 $\mathcal{X}$ ，但具有不同的分布；训练集包含 $D_S$ 、 $D_T$ ； $D_T$ 与测试集的分布相同；本文中，有 $\bold{0 < n \ll m}$ ；疑惑：如何划定 $D_S$ 、 $D_T$ )
1： $D^{'} = D$ 、 $\forall w_i = 1$
2：for $t = 1$ to $T$ do
3： $\text{WR} (D_S) + D_T$
4：模型 $h_t = \text{BL} (D')$
5：计算 $D_T$ 上的预测误差 $\varepsilon_{t}=\sum_{i=n+1}^{n+m} \frac{w_{i}^t\left|h_{t}\left(x_{i}\right)-y_{i}\right|}{\sum_{i=n+1}^{n+m} w_{i}^{t}}$
6： $t$ ++
7： if $\varepsilon_t > 0.5 \text{ or } t = T$ then
8：前往步骤5
9： else
10：设置 $\beta_t = \frac{\varepsilon_t}{1 - \varepsilon_t }$ 、 $\beta = \frac{1}{1 + \sqrt{2\ln \frac{n}{m + n}}}$
11： end if
12：更新权重 $w_{i}^{t+1}=\left\{\begin{array}{c}w_{i}^{t} \beta^{\left|h_{t}\left(x_{i}\right)-c\left(x_{i}\right)\right|}, 1 \leq i \leq n \\ w_{i}^{t} \beta_{t}^{-\left|h_{t}\left(x_{i}\right)-c\left(x_{i}\right)\right|}, n+1 \leq i \leq m\end{array}\right.$
13：end for
输出： $H^{*}(x)=\operatorname{argmax}_{y \in Y} \sum_{t: h_{t}(x)=y_{i}} \log \frac{1}{\beta}$