Bilinear Attention Networks 代码记录
torch.einsum是个好东西,就是输入数据多于2个,就有点看不懂了。(改成了使用torch.matmul主要是为了将代码和论文公式对应上)
其中,相关数据维度如下:
# 1 forward函数:
v_ [B, M, D]
q_ [B, L, D]
# 2 forward_with_weights函数:
v_ [B, M, D]
q_ [B, L, D]
w [B, M, L]
1 forward函数
# low-rank bilinear pooling using einsum
def for
原创
2021-04-19 16:31:17 ·
1247 阅读 ·
1 评论