沈向洋：如何以正确方式打开一篇科研论文？演讲总结

本文链接：https://blog.csdn.net/weixin_46052134/article/details/131645444

看了沈向洋博士的文字版演讲，总结一下笔记内容如下。

沈向洋博士分享：如何以正确方式打开一篇科研论文？

在这里插入图片描述

研究员的几个特质

一个好的研究员应该有几个特质:
1.Open-minded：这个世界只有想不出来的东西，没有做不出来的东西，同时要具有批判性思考的能力
2.努力工作
3.要不断更新自己的知识面，要读很多最新的东西
4.思考、交流，把自己学到的东西用起来

读文章的几个阶段

在这里插入图片描述

阶段	含义
“消极阅读”（passive reading）	大概知道文章讲了什么
“积极阅读”（ active reading）	主动思考这些知识有什么用
“批判性阅读”（critical reading）	思考这篇文章是否言之成理
“创造性阅读”（creative reading）	搞清楚文章对接下来的工作有什么帮助

为什么读论文这么难

1.读者本身母语不是英语，且科研论文本身写的也可能不是很好。
2.读者需要对论文主题有很深的背景知识储备，这个是初级阅读者较难客服的问题。
3.在阅读中遇到困难的时候，我们不知道应该从哪里、向谁寻求帮助
4.读完这个论文之后，如果我想深挖这个主题或者探索研究方向，出了向导师求助，还可以向谁寻求意见？
5.在当下的时代，能够长时间专注于读论文是一件很困难的事情。

香侬的信息论

在这里插入图片描述
目前为止，阅读和写作这两件事仍是脱节的，作者和读者的非直接沟通中必然有理解的偏差。这种关系可以用香侬的信息论原理来解释——论文是作者和读者之间交流信息的渠道，主要是单向传输，信息源是作者，而目的地就是读者。写作就像编码，阅读就像解码，所以我们需要一本 Codebook 来介绍“编码”到“解码”所需要的知识，也即作者按照这本 Codebook 中的规范进行“编码”，阅读者则用它来“解码”。
其实，香侬理论只是概括了阅读与写作的一部分，真实的阅读往往超越了传统的“传输-压缩”框架，它更多的是一个反复的理解过程。在这个过程中，读者不断地揣测作者的意图，并将之解构成能够理解的片段，随后这些片段被构建到读者脑中的认知模型里。所以，阅读等同于理解，不同层次的阅读对应不同层次的理解——深度阅读导致深度理解，浅显的阅读对应的必然是浅显的理解。不同需求应该对应不同的阅读层次，你可能需要快速浏览，可能需要仔细阅读，如果你的导师需要你复现论文中的细节，那么你就需要非常深入地研读。

阅读文章的三个层次：速读、精读与研读

了解了阅读的本质，那么我们应当如何阅读 paper 呢？

首先是要有“速读”的能力，快速知道一篇文章讲了什么。

其次是要“精读”。精读有两个方面：批判性阅读和创造性阅读。首先要对论文进行否定、质疑，仔细挑毛病；其次，对论文有了足够的了解之后，如果发现论文中提到的想法非常优秀，那么要创造性地思考你能用这篇论文做什么。

阅读	含义
批判性阅读	要对论文进行否定、质疑，仔细挑毛病
创造性阅读	创造性地思考你能用这篇论文做什么

第三个步骤，我称之为“研读”，比如说自己尝试将文章中的算法实现一遍。

除了阅读的方式，读者还要理解所读的论文是怎样写出来的。一篇好的论文在逻辑上是层层递进的，不仅能够传达信息也能够激励读者。所以作者在写的时候也是有结构化的逻辑性思考程度的。总体上作者会思考：这篇论文的真实任务是什么、研究发现是什么；论文的贡献是什么等等。

相应地，读者在读论文的时候也应该要有逻辑，首先要清楚论文中的表达是否是我想要学习到的；其次，我能从论文中学到多少，能不能找到新的方向与新的课题初稿；最后，这篇论文的背景是什么——是什么样的背景让这篇论文变得重要和有趣。

无论是计算机视觉领域的文章还是泛计算机类的文章，一般来讲，都可以归为以下几类：

提出问题型论文
解决问题型论文
阐述和调查型论文
总结型论文

快速阅读：如何读标题、摘要和引言

计算机视觉领域的著名学者 Don Geman 曾经说，一篇文章可以分为标题、摘要、引言、论文主体四个部分，每一部分都需要花同样的时间进行撰写。这个说法虽然夸张但是不无道理，因为大多数读者实际上最关注的就是文章开始的两页纸。对读者而言，看完前两页就知道这篇文章是不是值得去读；对 reviewer 而言，看完开头就知道能不能拒绝这篇文章。

标题

如何读论文的标题？标题一般只有一句话。从整篇论文的排版的角度来看，在一页半的引言、四分之一页的摘要以及八页的双栏正文面前，只有一句话的标题显得不太“重要”。但是标题是总结、抽象的概括。我曾有一个重要发现：高质量的文章通常标题用两个词就能概括，并以 ing 结尾，例如 Plenoptic sampling、Lazy Snapping、Poisson matting。所以对于读者来说在读这些抽象的词或句子的时候，只有花费较多的时间才能读懂论文作者的意图。

摘要

接下来，我将介绍如何读摘要。计算机学科论文中的摘要一般有固定格式，读起来非常枯燥。所以，要读摘要的时候，将其分解并加上一些有趣的亮点，可能有利于阅读。中国学生的英语一般都不太好，虽然到了研究生阶段，思维方式可能还停留在中文思维到英文思维转换的阶段。对此，一个很好的建议是尝试把摘要翻译成中文，在这个过程当中，你会发现自己有一些细节没有领会到位，第一遍读的时候不见得读懂了。

引言

Jim Kajiya 是一个非常了不起的图形学专家，Jim曾经写过一篇文章“How to get your SIGGRAPH paper rejected”，文中最核心的观点是文章一定要写得易读——这篇论文是关于什么的？它解决了什么问题？迷人之处在哪？有什么新的东西（我一直强调做科研的终极问题就是 what’s new，写文章的时候一定要强调文章中有什么新的东西）？巧妙之处何在？

如何读论文的引言？举个例子，我最近在读《拥有伦理学：企业逻辑、硅谷与伦理学的制度化》（Owning Ethics：Corporate Logics, Silicon Valley, and the Institutionalization of Ethics），在引言部分，我问了 Kajiya 提出的那几个问题。首先这篇论文讲的是高科技公司在道德方面做了什么；其次，解决的问题是现在的实践（拥有道德）做法；文章的迷人之处在于最近的丑闻和技术后冲（techlash）；这篇文章的最新之处是对 17 位科技公司的“道德拥有者”进行了采访；最后，论文的神奇之处是得出了结论：道德所有者在令人担忧的动态中运营公司。

问题	答案
这篇论文是关于什么的？	这篇论文讲的是高科技公司在道德方面做了什么
它解决了什么问题？	解决的问题是现在的实践（拥有道德）做法
迷人之处在哪？	文章的迷人之处在于最近的丑闻和技术后冲（techlash）
有什么新的东西？	最新之处是对 17 位科技公司的“道德拥有者”进行了采访
巧妙之处何在？	论文的神奇之处是得出了结论：道德所有者在令人担忧的动态中运营公司

仔细阅读：从批判性阅读到创造性阅读

在这里插入图片描述
以批判性阅读开始，带着质疑的心态问问题。如果作者论文中声称解决了一个问题，那么你就要在心里问自己：论文是否正确、真正地解决了问题？作者论文中所用方法是否有局限性？如果所读的论文没有解决问题，那么我能解决么？我能采用比论文中更简单的方法解决么？所以，一旦进入仔细阅读的状态，要在读论文之前对自己说：这篇论文可能有问题，我要找出来。这就是批判性阅读。

在这里插入图片描述
批判性阅读可能非常难，也可能占用你很多的时间，早期知识储备不够时，读论文的过程中很容易卡壳。常见的建议是找熟悉这方面工作的人帮忙，让他们解释你遇到的难点。但你要意识到找人帮忙也可能遇到困难，一方面，你要找谁帮忙？另一方面，如何能让他们愉快的接受你几分钟、十几分钟、甚至接近一个小时的咨询？他们不一定有那么多时间。所以我一直鼓励大家在研究生阶段一定要跟身边导师、师兄师姐、厉害的同学们搞好关系。等到你自己成为师兄师姐后，也要积极回应学弟学妹们的提问。

在这里插入图片描述
除此之外，也建议你们多找一些背景知识阅读，多做笔记，多在网上搜索相关论文，然后再次通读所卡壳的论文，并试着把它与其他论文相联系起来，如此坚持下去，定能渡过难关。
掌握了批判性阅读的技巧后，如何达到创造性阅读的层次呢？这时候你要问自己：在我所读的论文中，有哪些好的 idea？（一般文章中只有一个 idea，好的文章中可能有两个 idea，最了不起的文章可以有2.5个 idea。）搞清楚作者的 idea 以后你要思考，作者有哪些点还没有想到？可以怎么改进？如果我现在做这项研究，我能做的新事情是什么？
如果说批判性阅读是“negative thinking”，那么创造性阅读就是“positive thinking”。创造性的阅读需要把你所读的论文和其他相关的论文建立联系，从而产生一些新的想法，这些想法可以支撑你进行三个月到五个月的研究。如果读到了非常好的文章，不妨写一篇半页到一页左右的 review。最好做一个口头展示，这样你会发现，只有把东西写下来或者说出来才能真正深刻理解。
在这里插入图片描述
理解了一个东西以后，最重要的是能够自问自答，这张图片是一个总结，图片的上半部分是比较客观的问题，包括

上半部分客观的问题
论文的核心观点是什么？
主要的局限性是什么？
代码和数据是不是可得的？
论文的贡献是否有意义？
论文中的实验是否足够好？

图片的下半部分是比较主观的问题，包括

下半部分主观问题
我错过了什么相关论文么？
这对我的工作有何帮助么？
这是一篇值得关注的论文么？
这个研究领域的领头人是谁呢？
哪些公司、研究院、实验室值得关注？
其他的人对这篇论文有何看法呢？
如果有机会见到作者，我应该问作者什么问题？

当你在阅读论文的时候如果能回答出上面列出的问题，我相信你会对你所读论文有非常深刻的理解。

哪些可以帮助我们的工具

我还想跟大家分享一些能够帮助阅读论文的工具，例如谷歌以及必应网页搜索引擎、谷歌学术、arXiv 等能够搜索到你想要的论文，但这些工具都不能真正帮助我们读懂 paper。在阅读的过程中，OneNote 可以帮助你做笔记；CliffsNotes 作为美国知名的学习指南网站，能够提供文献学习指南；Mendeley 是非常优秀的参考文献管理。

另外也强烈建议大家使用在线论坛讨论论文，增加学术交流，增强对所读论文的理解能力，但是遗憾的是，尚未有非常适合讨论论文的在线论坛，现在的一些社交网络产品或许很棒，但是它并不是为了学术研究目的而设计，毕竟学术论文的“非有趣性”不适合社交产品的调性。

最后，我想向大家介绍几个小 tips。我最想强调的是要养成写小总结的习惯，最好能做报告，这样真的能够增加你对所读论文的理解。我想再次强调，大家一定要有耐心，因为阅读就是在你大脑中建立认知模型的过程，虽然不知道今天读的文章未来什么时候能够派上用场，但是请大家保持阅读、建立认知的习惯。
写到这里博客已经很长了，我把华刚博士提出的带着十个问题去阅读和思考放到另一个博客。
原文链接: 沈向洋、华刚：读科研论文的三个层次、四个阶段与十个问题