转换的时候,需要写一个caffe的proto,还好我之前是根据caffe模型写的pytorch模型,所以变量的命名基本一致,所以转换的时候做对应就简单一些。
设计网络的时候,最好用流程图画出网络模型,然后在开始写代码。
提取pth中模型参数的时候,不需要原始的网络,pth使用torch读取之后,就已经是一个dict结构了。
这个参数赋值给caffe的时候,需要caffe和torch权重的对应关系,然后一一赋值即可。
做好之后,将结果可视化出来,看看直观上看上去是否完全一致。最后如果有测试集的话,测试一下,转换是否有误差。