此文内容源自微信公众号"深度之眼“的《效率提升3倍的Paper阅读方法》。
1. 读哪些论文
从类型角度,论文可分为如下两大类,初步进入某个新领域时,建议先阅读综述论文,初步了解全貌。
- 综述论文:快速熟悉某个领域发展历程、现状及子方向,了解领域内基础概念及关键词
- 专题论文:介绍具体算法,可学习其设计思路,实验技巧,代码实现等具体技术
从质量角度,高质量论文的来源有:
- 高质量期刊会议:CVPR、ECCV、ICCV、AAAI、NLPS、ICLO、ICML等
- 高引论文:同行普遍认可、参考、借鉴的论文
- 知名团队:Yoshua Bengio、Yann LeCun、Geoffrey Hinton、Andrew Ng等
- 有代码的论文:“Talk is cheap. Show me the code." 是故,推荐网站:https://paperswithcode.com
2. 如何找论文
对于未知论文题目,依照关键词搜索相关领域论文
- 知网:寻找优质综述,快速入门
- 百度学术、google scholar
- arXiv:https://arXiv.org 论文预印本(preprint)平台
- 顶会:CVPR、ECCV、ICCV、AAAI、NIPS、ICLR、ICML等
筛选论文时,通常先考察期刊。评判期刊是否优质,看IF值。
- IF(Impact Factor,影响因子):期刊前N年发表的论文除以前N年发表的论文数,通常N=2或N=5
- JCR(Journal Citation Reports,期刊引证报告):统计SCI期刊的论文引用数据,给出各期刊IF
此外,还可以通过SCI期刊分区对期刊评判。
- JCR方式:一、二、三、四区各占25%(国际公认)
- 中科院方式:一区为前5%,二区为5%~20%,三区为20%至50%,四区为50%之后
3. 如何整理论文
人工手动管理:
- 统一命名格式:时间-作者-题名
- 按类别归入文件夹
当论文数量较多时,可借助第三方工具:endnote、Mendeley、Zotero、Citavi等
4. 如何读论文
读论文的困境有:重点难把握、论文关系复杂、公式图表难懂。
读论文三步曲:
- 泛读:快速浏览,把握概要。重点读(大小)标题、摘要、结论、图表等。泛读后要能回答三个问题:解决了什么问题?采用了什么方法?达到了什么效果?
- 精读:选出关键内容(或者兴趣点),进行仔细阅读
- 总结:总结文中创新点、关键点、启发点等重要信息
论文结构:
- Abstract 阐述工作内容、创新点、效果等
- Introduction 介绍研究背景、研究意义、发展历程、提出问题
- Related Work 相关研究算法简介,分析存在的缺点
- Our work 论文主要方法,实现细节
- Experiments 实现步骤及结果分析
- Discussion 论文结论及未来可研究方向
5. 学习路径
NLP的baseline论文:
- NLP综述
- Efficient Estimation of Word Representation in Vector Space
- CloVe: Global Vectors for Word Representation
- Compositional character models for open vocabulary word representation
- Convolutional Neural Network for sentence Classification
- Character-level Convolutional Networks for Text Classification
- Bag of Tricks for Efficient Text Classification
- Neural Machine Translation by Jointly learning to Align and Translate
- Hierarchical Attention Networks for Document
- SGM: Sequence Generation Model for Multi-label Classification
而后,我们可以细分专题,诸如:预训练模型、信息抽取、图神经网络、句子匹配、知识图谱等。