autoregressive
adj. 自回归的
eg: autoregressive model自回归的模型
autoregressive process自回归的过程
autoregressively
adv. 自回归地
eg: autoregressively predicted 自回归地预测
这个词在有道词典中查不到,但是在大佬的文章中是有这样的用法的
算法含义
token被一个一个地预测出来,预测第n个token会把前n-1个token看成输入。
在sampling程序中,如果是用autoregressive的方式预测n个token,就需要运行模型n次(每次得到的结果cat到input中,作为新的input)。 如果不是autoregressive的方式,运行一次模型就得到了结果。
作用
预测后面的token以前面的token为条件,加强对数据内部联系的学习。
缺点
费时间,sampling过程运行n步,假如是没有什么优化,O(n)时间复杂度,而普通方式是O(1)
一般保存 qkv 计算结果的方式来加速 ,就是不用每次都计算所有的 q*k^T