机器翻译:Sequence to Sequence Modeling with nn.Transformer

作者:禅与计算机程序设计艺术

1.简介

在近几年里,基于深度学习的神经网络在自然语言处理(NLP)领域逐渐成为主流,其主要应用领域之一就是机器翻译。其核心思想就是用计算机将一段文本从一种语言翻译成另一种语言,例如英文到中文或者中文到英文。目前最常用的机器翻译模型是 seq2seq 模型,即序列到序列模型。
Seq2seq 模型的基本思路是将输入序列通过编码器进行编码并得到固定长度的上下文表示,然后把此上下文表示作为解码器的初始状态,将目标序列通过解码器生成翻译后的文本。
本文将使用 pytorch 的 nn.Transformer 和 torchtext 来实现一个 seq2seq 模型,用来进行中文到英文的机器翻译任务。

2.基本概念、术语、名词解释

2.1 什么是 NLP?

Natural language processing,即自然语言处理,是指让电脑可以像人一样理解和交流自然语言的一门学科。它包括词法分析、句法分析、语义理解等多方面技术。

2.2 什么是机器翻译?

机器翻译(Machine Translation)是自动的将一段文本从一种语言翻译成另一种语言的过程。通常情况下,输入的是一段文本,输出也是一段文本,不过,也可以实现将输入的图像、视频或其他类型的文件翻译成文字。
从某种意义上来说,机器翻译类似于人类译者对单词及语句习惯、风格等的调整,使得阅读者或听众能够更容易理解作者的意图,并且传达出来的信息准确无误。

2.3 Sequence-to-seque

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 20
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 20
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

禅与计算机程序设计艺术

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值