论文阅读：Unsupervised Paraphrasing without Translation

最新推荐文章于 2024-01-16 01:05:29 发布

咕噜咕噜day

最新推荐文章于 2024-01-16 01:05:29 发布

阅读量541

点赞数 1

分类专栏： nlg_paper 文章标签： Unsupervised Pa 无监督转述非翻译形转述

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_36533552/article/details/106364470

版权

nlg_paper 专栏收录该内容

26 篇文章 3 订阅

订阅专栏

文章简介：

这篇文章提出只用无标签的单语语料学习转述模型，并提出了一个向量量化变分自动编码器（VQ-VAE）的残差变体；作者和基于机器翻译（监督和无监督）的方法对比，单语转述方法对无监督方法全面胜出，跟监督翻译对比在识别和增强方面胜出，生成方面不如；

方法：

作者提出的模型是对VQ-VAE decoder entropy 简单的优化，允许生成语义相似但是风格类型不同的句子；

paraphrasing model 评估：

1.内在评估：评估转述识别和转述生成；

2.外在评估：用转述的方式的数据增强对分类的影响；

基于残差VQ-VAE的无监督单语转述：

VQ-VAE和连续的VAE相反，依赖于离散的潜变量，类似于经典的聚类算法，利用共通的潜变量属性，达到显式控制一组输出类似的结果；作者围绕着量化模块，添加了一个连续残差连接的复杂模型：

作者修改了transformer encoder，映射一个句子到一个固定大小的向量，避免在输入和潜在表示之间选择固定的长度压缩速率，这个固定大小的特征表示类似于文本分类的特殊词（为社么需要一个输出和潜在表示之间的固定压缩率？）

然后encoder的输出也只限于这段固定大小的位置；因为使用multi-head，encoder输入是经过了一个量化模块才输出：

ci是 codebook vectors；每个head共享，

残差连接

根据VQ模块的定义，残差向量和量化向量总是具有相似的规范，所以不同于经典的连续残差？

PS：

红色部分插个眼，回头补上；

【1】VQ-VAE，the codebook vectors： Neural discrete representation learning

【2】VAE优化，rate regularization：beta-vae:Learning basic visual concepts with a constrained variational framework.

denoising objectives：Stacked denoising autoencoders: Learning useful representations in a deep network with a local denoising criterion.

咕噜咕噜day

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
论文阅读：Unsupervised Paraphrasing without Translation

文章简介：这篇文章提出只用无标签的单语语料学习转述模型，并提出了一个向量量化变分自动编码器（VQ-VAE）的残差变体；作者和基于机器翻译（监督和无监督）的方法对比，单语转述方法对无监督方法全面胜出，跟监督翻译对比在识别和增强方面胜出，生成方面不如；方法：作者提出的模型是对VQ-VAE decoder entropy 简单的优化，允许生成语义相似但是风格类型不同的句子； paraphrasing model 评估： ...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。