代码地址:GitHub - gaopengcuhk/SMCA-DETR
论文翻译解析:https://www.shlab.org.cn/news/5443081
在transformer.py文件中TransformerDecoderLayer类的forward下
偏移量预测:
计算距离(这里用到了广播机制):
单尺度:
高斯计算:
然后当作列表传入多头注意力机制:
这里会跳转到multi_head_attention_forward()函数去,先将输入列表形式的gaussian提取出为tensor,然后改变维度顺序,和注意力权重相加