gpushare.com_基于去噪Transformer的无监督句子编码【EMNLP 2021】

最新推荐文章于 2024-01-20 21:15:00 发布

置顶

AI酱油君

最新推荐文章于 2024-01-20 21:15:00 发布

阅读量787

点赞数 1

分类专栏：深度学习 AI行业新思文章标签： transformer 深度学习人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_53977063/article/details/122580449

版权

EMNLP 2021 上发表的TSDAE论文介绍了一种使用Transformer结构的序列去噪自编码器进行无监督句子嵌入学习的方法。通过在输入文本中添加噪声，如删除、交换和Mask词汇，训练Encoder生成固定大小的向量，Decoder再还原原始句子。实验结果显示TSDAE在STS数据集上的表现优于SimCSE和BERT-flow。作者还探讨了与BART方法的区别。

摘要由CSDN通过智能技术生成

文章来源 | 恒源云社区

原文地址 | 论文小记

原文作者 | Mathor

这几天忙里偷闲去社区看了看各位版主一开始发的文章。重点找了我最喜欢的版主Mathor的文章，仔细一查，竟然已经发了90多篇，不愧是社区大佬本佬了！

想着看都看了，那就顺手搬运一下大佬的文章吧！

接下来跟着小编的脚步👣，一起看下去吧～

正文开始

EMNLP2021 Findings上有一篇名为TSDAE: Using Transformer-based Sequential Denoising Auto-Encoder for Unsupervised Sentence Embedding Learning的论文，利用Transformer结构无监督训练句子编码，网络架构如下所示：
在这里插入图片描述
具体来说，输入的文本添加了一些确定的噪声，例如删除、交换、添加、Mask一些词等方法。Encoder需要将含有噪声的句子编码为一个固定大小的向量，然后利用Decoder将原本的不带噪声的句子还原。说是这么说，但是其中有非常多细节，首先是训练目标
在这里插入图片描述
其中， $D$ 是训练集； $x_1x_2\cdots x_l$

最低0.47元/天解锁文章

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。