论文阅读方法
本文记录今天看论文的体会,也希望和更多的人看到更好的读论文的方法。平时得益于博客的平台,得到了很多,希望我的小小付出,可以帮助到一部分人。
摸索了近一个月,读了几篇论文,但是总觉得枯燥,找不到兴趣点。并且还想着去干点其他的事,其实,一篇论文并不是从头读到尾,这样不仅难坚持,能学到的东西也很少,浪费掉很多的时间。
论文的习惯很重要。第一遍读的时候快速掌握模型的大致结构,可先不看引言和背景信息,找到每个阶段的重点。从整体到细节,快速了解文章大意 ,模型结构,模型的框架,训练过程(用了什么数据集,超参数是什么样的,实现的效果),分析-还存在的缺点,优势是什么。提出自己的疑惑,然后复现论文-实践。
- abstract ——解决了什么问题,主体模型用的什么方法,取得了什么样的效果。(精读)
- introduction——引出本文的模型方法,引出之前的模型缺点。
- background ——对摘要的进一步扩充,主要说明之前的那些经典模型都是怎么去解决问题的,解决问题的算法发展脉络是什么,以及对应的优缺点。(第一遍读的时间暂时可以不看)
- model architecture——idea产生的地方,推导公式理解会更深刻(精读部分)。why self-attention——模型和其他模型的比较,一般在实现完模型之后会有一个比较深刻的理解
- training