论文笔记 ICML 2017|Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs

hlee-top

已于 2022-03-30 23:43:57 修改

阅读量2.3k

点赞数

分类专栏：论文机器学习 NLP 文章标签：深度学习计算机视觉自然语言处理

于 2022-01-18 22:55:30 首次发布

本文链接：https://blog.csdn.net/o11oo11o/article/details/122565475

版权

论文同时被 3 个专栏收录

125 篇文章 12 订阅

订阅专栏

NLP

125 篇文章 14 订阅

订阅专栏

机器学习

5 篇文章 0 订阅

订阅专栏

文章目录

1 简介

论文题目：Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs
论文来源：ICML 2017
论文链接：https://arxiv.org/pdf/1703.04363.pdf
代码链接：https://github.com/gyglim/dvn

1.2 创新

提出一个deep value network(DVN)模型，将x和y作为输入，输出一个标量，衡量x和y的一致性。(学习批判不同的输出比学习直接提出最佳预测更容易)
在文本分类和图像分割任务上达到sota。

2 背景知识

Structured output prediction学习一个input到多元离散output的映射，loss函数如下(对于多分类任务使用负F1值；图像分割任务使用负IOU)：
在这里插入图片描述
优化得分函数，使预测得分接近负损失值：

在预测时：

3 方法

提出一个deep value network为 $v(x,y;\theta)$ ，预测一个标量，评估x和y的一致性，在训练期间假设oracle value function为：
在这里插入图片描述
用于图像分割和多标签分类的oracle value function包括 IOU 和 F1 指标：

使用简单的梯度下降优化器进行推理,将 $\in \{0,1\}^M$ 替换为 $\in [0,1]^M$ ,经过多次梯度上升：

为了训练DVN，需要扩展 $v * (y, y *)$ 的范围(以适应连续的输出y),对于IOU和F1分数，通过max和min扩展交集和并集的概念。
在这里插入图片描述
loss函数如下：

训练DVN的算法过程如下：

每一个训练样本包括input，output和oracle value,如 $x,y,v^*)$ ,生成训练样本有下面三种方式：

在训练期间进行基于梯度的推理
生成对抗样本( $v(x,y;\theta)$ 和 $x,y,v^*)$ 有很大的差异,通过最大化loss生成)
随机取样(可能与 $y^*$ 有偏差， $p(y)\propto exp\{v^*(y,y^*)/\tau \}$ )

4 实验

多标签分类选择的数据集为Bibtex和Bookmarks(使用SPENs作为模型结构)，实验结果如下图：
在这里插入图片描述
图像分割选择的数据集为Weizmann horses，使用的模型结构和实验效果如下图：

可视化结果：

在Labeled Faces in theWild数据集上进行图像分割的实验效果如下图：

可视化结果：

消融实验结果：

在Weizmann数据集上可视化模型学到的内容：
在这里插入图片描述

hlee-top

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
打赏
0
评论
论文笔记 ICML 2017|Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs

文章目录1 简介1.2 创新2 背景知识3 方法4 实验1 简介论文题目：Deep Value Networks Learn to Evaluate and Iteratively Refine Structured Outputs论文来源：ICML 2017论文链接：https://arxiv.org/pdf/1703.04363.pdf代码链接：https://github.com/gyglim/dvn1.2 创新提出一个deep value network(DVN)模型，将x和y作为输
复制链接

扫一扫