Q:添加的注意力机制的weight一直与cuda or cpu类型不匹配? 解决:将嵌入的(继承nn.module的类)网络整体使用.to(device)即可统一权重和input的tensor类型 pytorch中加入注意力机制(CBAM),以ResNet为例。解析到底要不要用ImageNet预训练?如何加预训练参数? - 知乎 (zhihu.com)https://zhuanlan.zhihu.com/p/99261200