顶级会议ICLR论文解读丨语法制导翻译VAE如何回答一代宗师叶问

最新推荐文章于 2023-03-26 16:34:19 发布

小拾1236

最新推荐文章于 2023-03-26 16:34:19 发布

阅读量226

点赞数

本文链接：https://blog.csdn.net/cpongo10/article/details/98733903

版权

640?wx_fmt=jpeg

原创作者：谭婧

美编：陈泓宇

-随堂测验-

俗话说，南拳北腿。

咏春拳作为经典的南派功夫，讲究贴身近击、连消带打与攻守合一。咏春高手的双手知觉灵敏且变化多端，防守时密不透风、滴水不漏，进攻时犹如水银泻地、插缝即入。初看斯文冷静、再看后发先至、以疾如风的速度、爆发出雷霆之力对敌。

叶问VS生成模型。

一代宗师叶问先生笑意慈祥，摆出咏春拳的标志性——问路手，

说道：“咏春，叶问。”

见此状后，生成模型生成：___________。

（答案见文末）

640?wx_fmt=png

言归正传，变分自动编码器（Variational AutoEncoders，VAEs）模型，在2013年由Kingma学者提出，几年以来，变分自动编码器（以下简称VAE）已经成为一种流行的生成模型（Generative model），通过无监督的方式学习复杂的分布。论文提出一种新的VAE，以下详解。 640?wx_fmt=jpeg

丨The paper won the best paper award for NIPS workshop.

一、论文摘要与作者

随着时间序列和图像等连续数据建模的深入，深度生成模型进展迅速，但要生成语法和语义正确的离散结构化数据（如化学分子和计算机程序）仍然具有挑战性。这篇论文受编译器理论的启发，提出一种新的语法导向的变分自动编码器（SD-VAE）。

语法制导翻译（SDT，syntax-directedtranslation）通过语法和语义检查以及随机惰性属性（stochastic lazyattributes）两个技术点实现对生成模型（解码器）的动态约束。与前人方法相比，论文所述方法能够输出不仅在语法上是正确的，而且在语义上也是合理的。论文作者们评价了该方法在程序的生成和分子的优化上的应用。结果表明，在离散数据的生成模型中引入语法和语义约束效果提升明显。

第一作者：

佐治亚理工学院计算机学院，戴涵俊

第二作者：

石溪大学计算机科学系，田应涛

第二作者：

石溪大学计算机科学系，StevenSkiena

第四作者：

蚂蚁金服，人工智能首席工程师，宋乐

论文链接：https://arxiv.org/abs/1802.08786

二、论文简介

640?wx_fmt=png

（一）能力

生成模型比较火，主要用于生成图像，或者生成文本，也许你听过今日头条新闻机器人张小明（xiaomingbot）的神勇：2秒钟写稿，拟人化语言，智能配图。其技术原理就是使用的生成模型。也许你还听过将原始的照片或者绘画作品转化成拥有类似艺术风格的图像。文艺青年的压力突然大起来，写作和绘画都被机器占了先机，你到哪里去说理？但是，讲道理，从上面的例子我们知道，生成模型非常的有用，可由可能的数据的概率分布估计出来，然后可以生成像以前的图像，但是和以前不是一模一样，可以和以前有所类似。比如给模型人脸的图像，它会给你人脸的图像，而不是生成喵星人的脸还是汪星人的脸。你一定希望使用了生成模型之后，生成的图像稍有变化，如果生成和以前一模一样的脸，那也没有用。就好比朋友圈的一些自拍狂，同一张图片摆满九宫格，你就告诉我，是想让我来找出每张照片的不同吗，还是让人一口气连看九遍。如今，连生成模型都不屑生成一模一样的新数据。

使用了生成模型，希望把以前的数据特征，在模型里被抓住，但是能够产生一些新样品，无论是图像还是文本都是如此。你需要生成新的东西，就好像人一样，人的智能就是产生新的东西。不仅能把以前的东西学过来，而且能产生一些全新的东西。

（二）缺陷

生成模型有很大能耐，但是也有一个缺陷。生成模型对自己生成的条件，没有办法控制。比如想生成一个序列对应分子的化学表达式，这种离散结构的数据有一个特点，就是不是每一个生成的样本都是合理的，或者语法正确的。

论文中，我们提出三个条件：

1.和原来的数据集要像。学到原数据集的特征分布。

2.生成的离散结构具有多样性。

3.合乎形式语言文法

（同学们，划重点、敲黑板）

下面是论文中模型对离散数据的嵌入空间进行插值得到的生成结果。

简单程序：

640?wx_fmt=png

化学分子：

640?wx_fmt=png

三、对话论文作者

1.如何简单的理解论文提出的新方法？

我们利用语法制导翻译这个方法，将离线语义检查变成生成过程的在线指导，重塑了生成模型的输出空间，使它变得更加有意义，如图1所示。即使增加表达特征的能力（increased capacity），我们的方法与以前的高效学习和推理模型相比并没有增加计算成本。它在化学分子和计算机程序的各种任务上产生了显著的、持续的改进，表现出了其解决现实世界问题的实证价值。

重塑了生成模型的输出空间，使它变得更加有意义。

640?wx_fmt=png

我们的方法将离线属性语法转换为动态生成过程，如图2所示。

640?wx_fmt=png

在属性文法（Attribute Grammar）中，有一些继承的和合成的属性，是离线计算的，以确保语义正确性。为了能在生成过程中实时确保语义正确性，我们引入了随机惰性属性，将相应的合成属性转换为生成过程中的约束。惰性链接机制（lazy linking mechanism）设置了属性的实际值，一旦所有其他相关属性都准备好了，就如图3所示。实验结果表明，我们提高了重建精度和有效的先验精度，这两种方法都是变分自动编码器的重要质量指标，如图4所示。

640?wx_fmt=png