李宏毅老师-transformer part1

本文探讨了Transformer模型的重要性,提出了直接进行语音翻译的设想,期望通过Transformer实现对语音的直接理解和翻译,从而省去语音识别和机器翻译之间的步骤。
摘要由CSDN通过智能技术生成

transformer

Transformer是一个sequence to sequence(seq2seq)的模型
输入一个序列,输出一个序列。这两个序列的长度、关系是由模型自己确定的。

為什麼我们不直接先做一个语音辨识,再做一个机器翻译,把语音辨识系统跟机器翻译系统,接起来就直接是语音翻译?

那是因为世界上有7000种语言,这7000种语言中超过半数是没有文字的。
对于这些语言,根本就没有办法做语音辨识。

在这里插入图片描述

但我们有没有可能对这些语言,做语音翻译,直接把它翻译成,我们有办法阅读的文字呢?

一个很好的例子是台语的语音辨识,但很多人觉得台语是有文字的
其实台语的文字并没有那么普及
如果你做语音辨识,给机器一段台语,它可能输出是母汤,并不知道输出的是什么

所以,我们期待机器能够做语音翻译,对它说一句台语,就能输出对应意思的中文

我们可以通过训练一个类神经网络,input台语,output中文。
其实这样的资料还是能够收集到的,比如YouTube上的乡土剧

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值