[半监督学习] Learning Safe Prediction for Semi-Supervised Regression

码侯烧酒

已于 2022-02-18 23:58:46 修改

阅读量415

点赞数 1

分类专栏：论文文章标签：机器学习人工智能

于 2022-01-12 21:30:24 首次发布

本文链接：https://blog.csdn.net/by6671715/article/details/122431800

版权

论文专栏收录该内容

27 篇文章 15 订阅

订阅专栏

半监督学习(SSL)关注如何通过使用额外的未标记数据来提高学习性能的问题, 然而, 尽管 SSL 取得了成功, 例如 Co-training, FixMatch 等, 但大量的实证研究表明, 利用未标记数据的 SSL 可能会恶化学习性能. 所以本文提出了一种安全预测的半监督学习方法 SAFER.

论文地址: Learning safe prediction for semi-supervised regression
代码地址: http://www.lamda.nju.edu.cn/code_SAFER.ashx
会议: AAAI 2017
任务: 回归

SAFER

定义 $\{f_1,\dots,f_b\}$ 为多个半监督回归器的集合, $f_0$ 为对带标签的数据集直接用监督学习训练得到的回归器, $f_i \in \mathbb{R}^u$ , $i=0,\dots,b$ . $b$ 和 $u$ 分别表示回归器和不带标签的实例的数量. 令最终的预测函数为 $g(f_1,\dots,f_b,f_0)$ .

在没有关于学习器可靠性的领域知识的情况下, 为了减轻计算开销, 将 SAFER 问题表示为几何投影问题, 最大化 $g(f_1,\dots,f_b,f_0)$ 相对于 $f_0$ 的性能增益. 这有两点好处: (1) 由此产生的新公式是一个简单的凸二次函数, 并且更容易求解. (2) 如果基础 SSR 学习器的凸线性组合实现了有效的正确的数据标签(Ground Truth, GT)的分配, 则可以证明 SAFER 是安全的, 并且已经实现了最大的性能增益.

Problem Setting and Formulation

目前的挑战是学习安全的预测 $g(f_1,\dots,f_b,f_0)$ , 它通常优于 $f_0$ . 从最简单的情况开始, 假定 SSR 回归器的权重是已知的, 并令其为: $\alpha = [\alpha_1,\dots,\alpha_b] \geq 0$ , 其反映的是 $f_i$ 预测结果与真实标签的接近程度, 权重越大表示越接近真实值. 这里使用 MSE 来衡量对 $f_0$ 的性能增益. MSE 计算如下:
$\vert\vert f_0-f^*\vert\vert^2 - \vert\vert f-f^*\vert\vert^2$
其中, $f^*$ 对应着真实标签. 显然 $f^*$ 是未知的, 否则很容易推导出最优解. 由于各回归器的权重已知, 问题变为优化以下函数:
$\underset{f \in \mathbb{R}^u}{\max} \sum_{i=1}^b\alpha_i(\vert\vert f_0-f^*\vert\vert^2 - \vert\vert f-f^*\vert\vert^2) \tag{1}$
然而, 在现实中, 单个回归器的显式权重很难知道, 为了使提案更实用, 假设 α 来自候选集. 为简单起见, 假设 $\alpha$ 来自凸线性集 $\mathcal{M}=\{\alpha\vert\mathbf{A}^\mathrm{T} \leq b;\alpha \geq 0 \}$ , $\mathbf{A}$ 和 $b$ 是任务相关系数. 假设 $f_i$ 比 $f_j$ 更可靠, 所有这些索引 $(i, j)$ 的集合表示为 $\mathcal{S}$ , 则 $\mathcal{M}$ 将被设置为 $\{\alpha\vert \alpha_j-\alpha_i \leq 0;(i,j)\in\mathcal{S};\alpha \geq 0 \}$ . 在没有进一步的知识来确定单个回归器的权重的情况下, 我们的目标是优化最坏情况下的性能增益, 计算如下:
$\underset{f \in \mathbb{R}^u}{\max} \underset{\alpha \in \mathcal{M}^u}{\min} \sum_{i=1}^b\alpha_i(\vert\vert f_0-f_i\vert\vert^2 - \vert\vert f-f_i\vert\vert^2) \tag{2}$

Representation to Geometric Projection

注意, 式(2)对 $f$ 是凹的, 对 $\alpha$ 是凸的, 因此它被认为是鞍点凸优化问题. 然而, 式(2)的优化遇到了一些困难, 因为梯度下降算法导致的收敛速度差, 不能有效地进行求解. 为了减轻计算负担并理解式(2)的工作原理, 将在下文中将式(2)表示为几何投影问题.

对式(2)求导并令其等于0, 得到闭式解:
$\sum_{i=1}^b\alpha_if_i \tag{3}$
将式(3)代入式(2), 得到以下仅与 $\alpha$ 有关的等价形式:
$\underset{\alpha \in \mathcal{M}^u}{\min} \vert\vert \sum_{i=1}^b\alpha_if_i-f_0 \vert\vert^2 \tag{4}$
显然式(4)是简单的凸二次规划. 通过扩展等式中的二次形式. 式(4)可改写为:
$\underset{\alpha \in \mathcal{M}^u}{\min} \alpha^{\mathrm{T}}\mathbf{F}\alpha -\mathbf{v}^{\mathrm{T}}\alpha\tag{5}$
其中, $\mathbf{F} \in \mathbb{R}^{b \times b}$ 是关于 $f_i$ 的线性核矩阵, $\mathbf{F}_{ij}=f_i^{\mathrm{T}}f_j$ , $\mathbf{v}=[2f_1^{\mathrm{T}}f_0;\dots;f_b^{\mathrm{T}}f_0]$ . 由于 $\mathbf{F}$ 是半正定的, 所以式(5)为凸函数(最优化理论), 求解凸二次规划通常比鞍点凸优化更有效.

在求解最优解 $\alpha_i$ 后, 根据式(3), 就得到最优解 $\overline{f} = \sum_{i=1}^b\alpha_i^*f_i$ . 综上, SAFER 算法总结如下:
在这里插入图片描述
不难发现, 式(4)是一个投影问题. 定义 $\Omega=\{f\vert\sum_{i=1}^b\alpha_if_i,\alpha \in \mathcal{M}\}$ , 式(4)可以被重写为:
$\overline{f} = \underset{f\in\Omega}{\argmin} \vert\vert f-f_0\vert\vert^2 \tag{6}$
其为学习一个 $f_0$ 在凸集 $\Omega$ 上的投影.

How the Proposal Works

如下图所示, 如果 $f^∗ \in \Omega$ , $\vert\vert \overline{f}-f^*\vert\vert$ 应该小于 $f_0-f^*\vert\vert$ .
在这里插入图片描述
如果 $f^∗ \in \Omega=\{f\vert\sum_{i=1}^b\alpha_if_i,\alpha \in \mathcal{M}\}$ , 得到下面两条定律:
Theorem 1. $\vert\vert \overline{f}-f^*\vert\vert \leq \vert\vert f_0-f^*\vert\vert$ .
Theorem 2. $\overline{f}$ 已经实现了在最坏情况下对 $f_0$ 的最大性能增益. $\overline{f}$ 是以下函数的最优解:
$\overline{f} = \underset{f\in\mathbb{R}^u}{\argmax} \underset{f^*\in\Omega}{\min} (\vert\vert f_0-f^*\vert\vert^2 - \vert\vert f-f^*\vert\vert^2)$

码侯烧酒

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
[半监督学习] Learning Safe Prediction for Semi-Supervised Regression

半监督学习(SSL)关注如何通过使用额外的未标记数据来提高学习性能的问题, 然而, 尽管 SSL 取得了成功, 例如 Co-training, FixMatch 等, 但大量的实证研究表明, 利用未标记数据的 SSL 可能会恶化学习性能. 所以本文提出了一种安全预测的半监督学习方法 SAFER.
复制链接

扫一扫