Zero-shot 机器翻译和无监督条件GAN

最新推荐文章于 2024-06-10 16:16:34 发布

triplemeng

最新推荐文章于 2024-06-10 16:16:34 发布

阅读量1.2k

点赞数 1

分类专栏： GAN 自然语言处理，注意力模型 zero-shot 文章标签：神经网络自然语言处理人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/triplemeng/article/details/107552334

版权

本文探讨了无监督学习在智能领域的核心地位，并以Zero-shot机器翻译和无监督条件GAN为例，揭示两者在算法和方法上的相似性。通过CycleGAN的原理与机器翻译的back-translation进行类比，阐述了如何在没有平行语料库的情况下进行翻译和图像风格转换。这种无监督学习的方法对于解决实际问题，如小语种翻译和图像风格转换，具有重要的实用价值。

摘要由CSDN通过智能技术生成

这个题目很拗口。我的本意是说这两个东西：零样本的机器翻译，和无监督条件GAN 其实很像，如果抛开二者的domain不同(一个是NLP，一个一般是在图像领域)，这两者简直一模一样。

目录

无监督学习
zero-shot机器翻译
无监督条件GAN
- 算法
相似

无监督学习

Yann Lecun多次提到这样的类比: 如果把“智能”（intelligence）比作一个蛋糕，那么无监督学习就是蛋糕本体，监督学习是蛋糕上的糖霜，而增强学习是蛋糕上的樱桃。我们知道如何得到糖霜和樱桃，但不知道怎样做蛋糕。今天少样本甚至零样本的学习，都是在更基础的方向上(蛋糕本体)发力，而且取得了很好的效果。远的不说，最近的GPT3利用海量文本通过自(无)监督学习就在很多任务达到惊人效果。

回到机器翻译。现实生活中，很难保证有高质量的语言翻译的平行语料库，尤其是对小语种来讲。所以做零样本翻译非常有实用价值。

zero-shot机器翻译

前面有两篇文章介绍过这个方向。最近Facebook做出来的TransCoder是一个很好的应用。上一篇文章(TransCoder介绍)解释过具体的细节。大致上分这么三步走:

初始化MT
老的做法是直接用双语词典训练一个最简单的翻译模型；高级一点的做法是可以用MLM来初始化。
用单语料文本自学习一个DAE(Denoising auto-encoder)
好处是让翻译模型的encoder部分更加robust，而且decoder也学会了翻译(虽然是对单语言的"翻译")。
用back-translation来学会语言之间的翻译。
这也是最关键的一步。如下面右图所示，首先
从源语言x翻译到目标语言y，再翻译到源语言 $\hat{x}$ ，最后最小化李逵x和李鬼 $\hat{x}$

最低0.47元/天解锁文章

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
Zero-shot 机器翻译和无监督条件GAN

这个题目很拗口。我的本意是说这两个东西：零样本的机器翻译，和无监督条件GAN 其实很像，如果抛开二者的domain不同(一个是NLP，一个一般是在图像领域)，这两者简直一模一样。目录无监督学习zero-shot机器翻译无监督条件GAN效果相似无监督学习Yann Lecun多次提到这样的类比: 如果把“智能”（intelligence）比作一个蛋糕，那么无监督学习就是蛋糕本体，监督学习是蛋糕上的糖霜，而增强学习是蛋糕上的樱桃。我们知道如何得到糖霜和樱桃，但不知道怎样做蛋糕。今天少样本甚至零样本的学习，
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。