transformer中的autoregressive什么意思

autoregressive

adj. 自回归的
eg: autoregressive model自回归的模型
autoregressive process自回归的过程

autoregressively

adv. 自回归地
eg: autoregressively predicted 自回归地预测
这个词在有道词典中查不到,但是在大佬的文章中是有这样的用法的
在这里插入图片描述

算法含义

token被一个一个地预测出来,预测第n个token会把前n-1个token看成输入。
在sampling程序中,如果是用autoregressive的方式预测n个token,就需要运行模型n次(每次得到的结果cat到input中,作为新的input)。 如果不是autoregressive的方式,运行一次模型就得到了结果。

作用

预测后面的token以前面的token为条件,加强对数据内部联系的学习。

缺点

费时间,sampling过程运行n步,假如是没有什么优化,O(n)时间复杂度,而普通方式是O(1)
一般保存 qkv 计算结果的方式来加速 ,就是不用每次都计算所有的 q*k^T

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

会写代码的孙悟空

赠人玫瑰 手有余香

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值