torch.bmm是batch的乘法操作,即1 * 1 * 10与1 * 10 * 256的矩阵会变成1 * 1 * 256
注意力机制
最新推荐文章于 2024-07-13 07:30:00 发布
torch.bmm是batch的乘法操作,即1 * 1 * 10与1 * 10 * 256的矩阵会变成1 * 1 * 256