机器学习李宏毅学习笔记38


前言

生成式学习两种策略:各个击破/一次到位
有结构的生成物比如语句、影像、声音等。


一、生成式学习

语句的生成单位:token,在中文中就是一个中文字,在英文中是word piece(比如unbreakable->un break able三个token),比如在gpt中,拆成word piece是可以穷举的,而如果是一个word无法穷举。
影像:像素
声音:16k取样频率,每秒有16000个取样点

二、各个击破和一次到位的对比

1.各个击破(Autoregressive(AR) model)

比如gpt,一次生成一个token,图像就一次生成一个像素,最后生成一整个图片。
这种方法每一个单位的生成都需要等前面一个单位生成出来,相比于一次到位速度较慢。各个击破的生成品质比一次到位的更好。
在这里插入图片描述

2.一次到位(Non-autoregressive(NAR) model)

只要有足够的平信运算能力,就可以很快生成出结果(多用于影像生成)。
在这里插入图片描述
可以固定输出长度,在这个长度内有没有出现结束标志,如果遇到结束标志就结束。也可以先生成一个数字,这个数字表示最终输出的长度。
在这里插入图片描述
各个击破第一个输出可以使老也可以是演,sample的结果可能是概率高的也可能是概率低的,第二个输出的就相比来说比较稳定。但如果是一次到位,输出的结果可能是“老员”,不是一个正确的答案。这也就是为什么各个击破的质量比较好。

对比:
在这里插入图片描述
在这里插入图片描述
将两者结合起来,先用各个击破生成中间产物,最后用一步到位把结果产生出来。这样可以将两者的优点结合起来。
也可以把一次到位改成多次到位,每次的一次到位决定一个大方向,这样就不会出现不知道选哪一个答案,而把两个答案综合起来的问题。(diffusion model)
在这里插入图片描述


总结

视频学习地址:https://www.bilibili.com/video/BV1TD4y137mP?p=15&vd_source=3a369b537e1d34ff9ba8f8ab23afedec

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值