多任务学习进化史

最新推荐文章于 2024-02-03 02:18:34 发布

ckqsars

最新推荐文章于 2024-02-03 02:18:34 发布

阅读量700

点赞数

分类专栏：算法文章标签： machine-learning

本文链接：https://blog.csdn.net/ckqsars/article/details/78257002

版权

算法专栏收录该内容

20 篇文章 2 订阅

订阅专栏

(未经允许，不得转载)
本文结合各个博客以及论文整理的资料，如有版权问题，请告知。

首先多任务学习的定义：我们常说的多任务学习其实有3种情况：
1）同一dataset，要解决不同的task。
例如：针对一篇文章进行分词、词性标注、句法分析等，所用的数据都是一篇文章，但是对应的task不同。
2）不同的dataset，解决相同的task。
例如：对不同学校的学生成绩进行预测问题。

本文主要介绍的是情况2所对应的算法的演变。如需了解具体的算法实现以及计算过程，请去看论文。

本文主要的衍生以04的Regularized Multi–Task Learning为起始。

在最初的假设中：对于不同的dataset的task存在这共同的联系。以回归模型类例：

每个任务的变量的权重由公共联系以及各自的特性组成即：

$W_t = W_0 + V_t$

其中 $W_0$ 是公共权重， $V_t$ 是每个task自身的特性。
因此目标函数为：

min w 0, v t, ξ i t {J (w 0, v 0, ξ i t) : = \sum t = 1 T \sum i = 1 m ξ i t + λ 1 T \sum 1 T | | v t | | 2 + λ 2 | | w 0 | | 2

$\begin{align} \min\limits_{\mathrm{w_0},\mathrm{v_t},\xi_{it}}\{ J(w_0, v_0, \xi_{it}): = \sum\limits_{t=1}^T \sum\limits_{i=1}^m \xi_{it} + \frac{\lambda_1}{T}\sum\limits_{1}^{T}||\mathrm{v_t}||^2 + \lambda_2||\mathrm{w_0}||^2 \end{align}$
其中

s.t. y i t (w 0 + v t) \cdot X i t \geq 1 - ξ i t ξ i t \geq 0

$\begin{align} \mbox{s.t.}\quad y_{it}(\mathrm{w_0}+\mathrm{v_t}) \cdot \mathrm{X_{it}} \ge 1- \xi_{it} \\ \xi{it} \ge 0 \end{align}$

此文章中的假设为所有的task之间的feature都是存在相关联，但是实际情况中并不一定。因此有人提出通过惩罚函数的一范数来使得feature之间的联系稀疏化。文章连接：Multi-Task Feature Learning

假设：不同任务之间的只有一小部分的feature存在关联性。
目标函数：

min {\sum t = 1 T \sum i = 1 m L (y i t, ⟨ w t, x t i ⟩) + γ \sum t = 1 T ⟨ w t, D + w t ⟩ : A \in I R d * T}

$\begin{align} \min\left\{ \sum\limits_{t=1}^T\sum\limits_{i=1}^mL(y_{it},\left\langle w_t,x_{ti} \right\rangle) + \gamma\sum\limits_{t=1}^T\left\langle w_t, D^+w_t\right\rangle: A\in IR^{d*T} \right\} \end{align}$

其中 $\left\langle w_t,x_{ti}\right\rangle = \sum_{j=1}^d w_{tj}*x_{tij}$ T为Task的个数，m为没个Task中样本的个数.
$w_t = \sum_i a_{it}u_i$