#全部来自苏剑林老师博客
直接外推增加了维度 线性内插使得维度不对等
NTK-aware scaled RoPE
Transformer升级之路:2、博采众长的旋转式位置编码 - 科学空间|Scientific Spaces
Transformer升级之路:10、RoPE是一种β进制编码 - 科学空间|Scientific Spaces
为什么加位置关系:感知到token顺序
#全部来自苏剑林老师博客
直接外推增加了维度 线性内插使得维度不对等
NTK-aware scaled RoPE
Transformer升级之路:2、博采众长的旋转式位置编码 - 科学空间|Scientific Spaces
Transformer升级之路:10、RoPE是一种β进制编码 - 科学空间|Scientific Spaces
为什么加位置关系:感知到token顺序