代码参考链接
链接1
链接2
强调注意看issue部分,动态卷积的参数初始化很重要,Bias初始化的部分有错误。需要根据issue进行修改。self.bias = nn.Parameter(torch.zeros(K, out_planes))
![在这里插入图片描述](https://i-blog.csdnimg.cn/blog_migrate/e93e2198b9106c8225b994b38abd1c08.png)
论文理解材料
链接
核心思想,原来是多个样本采用一组固定的卷积参数,现在是每个样本输入,对应生成一组卷积参数,训练的时候有K个卷积核参数,通过attention模块产生K个参数,组合叠加生成对应的一组卷积参数。
另外,高维特征适合作为动态卷积的输入,需要根据实际任务场景进行微调。