【李宏毅2021机器学习深度学习】Transform

写在前面

[视频学习-bilibili] | [课程主页——sample code & slide] | [ML2021学习笔记] | [homework_code]

Transform是什么

在这里插入图片描述

硬train一发(语音识别)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

语音合成

在这里插入图片描述

Seq2seq其它应用(文字->文字)

在这里插入图片描述

其他应用QA

在这里插入图片描述

特制化模型有更好的效果,参考往年教程

在这里插入图片描述

其它应用(文法解析)

在这里插入图片描述
在这里插入图片描述

其它应用(Multi-label Classification,硬做)

在这里插入图片描述

Object Detection(硬做)

在这里插入图片描述

Seq2seq

在这里插入图片描述
在这里插入图片描述

Encoder

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

其它Transform架构(更多)

在这里插入图片描述

Decoder

在这里插入图片描述

Autoregressive

在这里插入图片描述

在这里插入图片描述

Masker(不能看后面的资讯)

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

输出是多少个呢?(Adding Stop Token)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Non-autoregressive(NAT)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Encoder - Decoder

在这里插入图片描述
在这里插入图片描述

Cross attention(运作过程)

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

各式各样的连接方式

在这里插入图片描述

Training

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

Tips

Copy mechanism

在这里插入图片描述

在这里插入图片描述

在这里插入图片描述

Guided Attention

训练的时候也会出现奇奇怪怪的问题(比如短的发财,发没发音,只有财,漏字了)

在这里插入图片描述

解决方法:从左往右限制(也是大坑,留个资料)

在这里插入图片描述

Beam Search(有时有用(确定性答案,语音合成),有时无用(随机性,创造性的任务不行))

在这里插入图片描述

在这里插入图片描述
在这里插入图片描述

评估指标(BLEU score)

在这里插入图片描述
在这里插入图片描述

exposure bias(训练的时候都是正确的,但是预测的时候不知道,可能一步错步步错。一个可能的办法:给训练的时候加点错误的资料…这一招叫做:Schedule Sampling)

在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

讲完了(Encoder-Decoder-它们中间的关系-怎么训练-Tips)

在这里插入图片描述

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值