![fac2074880808a7b9a82c5212dea869d.png](https://i-blog.csdnimg.cn/blog_migrate/a7b75aed91c15cd25bcdd140edf38104.jpeg)
深度学习论文的复现一直是一个比较耗时的事情(感谢那些发paper带code的作者!)。与此同时,由于一些作者的编程习惯不太好(比如不写文档,不写注释),让阅读代码的速度也慢上不少。如果各位的代码能力不强,读起代码就是真滴难受(比如我。。),于是乎我就想办法尽可能减缓以上问题代码的损失,所以就写下本文。
本专题主要分两部分:
- 深度学习相关论文中常见的代码实现结构(这篇文章讲这个)
- 各种各样奇形怪状loss的实例
最近偷偷看了一筐论文(我吹的),主要是GAN/网络设计/模型压缩方面的,发现不同子领域之间的代码风格和结构有较大的差异(比如GAN/网络架构设计/模型压缩就是三个子领域),但是同个子领域内的代码结构大体相同。同时我发现了,当对代码结构有足够的理解之后,在看其他相似结构的代码的时候速度会快上许多。而且在尝试复现某篇论文代码的时候,采用相应领域常见的结构设计方式也会使得复现的速度加快不少。同时我发现采用同领域的代码结构可以大大加快idea的代码实现,就像自己的utils(工具包),就像现成的数学公式往里套数字一般。
于是我就把常见的一些代码结构总结了一下,相似结构的代码和论文我之后总结完会附在