sub x2, x2, x3, lsl #1
表示,x3=x3<<1, 然后x2 = x2-x3
ld1 {v22.1D - v23.1D}, [x2], x3
ext v16.8B, v22.8B, v23.8B, #1
ext v17.8B, v22.8B, v23.8B, #2
第一行,相当于连续读取两个64bits的数据到两个寄存器,同时x2偏移增加两次
ld1 v22.1D, [x2], x3
ld1 v23.1D, [x2], x3
第二行ext是extract,该指令index为1,相当于把v22.8B的高7位和v23.8B的低1位,合并存入v16.8B
第三行类似,相当于把v22.8B的高6位和v23.8B的低2位合并存入v17.8B。相当于向右移动窗口取数