看了沈向洋博士的文字版演讲,总结一下笔记内容如下。
沈向洋博士分享:如何以正确方式打开一篇科研论文?
研究员的几个特质
一个好的研究员应该有几个特质:
1.Open-minded:这个世界只有想不出来的东西,没有做不出来的东西,同时要具有批判性思考的能力
2.努力工作
3.要不断更新自己的知识面,要读很多最新的东西
4.思考、交流,把自己学到的东西用起来
读文章的几个阶段
阶段 | 含义 |
---|---|
“消极阅读”(passive reading) | 大概知道文章讲了什么 |
“积极阅读”( active reading) | 主动思考这些知识有什么用 |
“批判性阅读”(critical reading) | 思考这篇文章是否言之成理 |
“创造性阅读”(creative reading) | 搞清楚文章对接下来的工作有什么帮助 |
为什么读论文这么难
1.读者本身母语不是英语,且科研论文本身写的也可能不是很好。
2.读者需要对论文主题有很深的背景知识储备,这个是初级阅读者较难客服的问题。
3.在阅读中遇到困难的时候,我们不知道应该从哪里、向谁寻求帮助
4.读完这个论文之后,如果我想深挖这个主题或者探索研究方向,出了向导师求助,还可以向谁寻求意见?
5.在当下的时代,能够长时间专注于读论文是一件很困难的事情。
香侬的信息论
目前为止,阅读和写作这两件事仍是脱节的,作者和读者的非直接沟通中必然有理解的偏差。这种关系可以用香侬的信息论原理来解释——论文是作者和读者之间交流信息的渠道,主要是单向传输,信息源是作者,而目的地就是读者。写作就像编码,阅读就像解码,所以我们需要一本 Codebook 来介绍“编码”到“解码”所需要的知识,也即作者按照这本 Codebook 中的规范进行“编码”,阅读者则用它来“解码”。
其实,香侬理论只是概括了阅读与写作的一部分,真实的阅读往往超越了传统的“传输-压缩”框架,它更多的是一个反复的理解过程。在这个过程中,读者不断地揣测作者的意图,并将之解构成能够理解的片段,随后这些片段被构建到读者脑中的认知模型里。所以,阅读等同于理解,不同层次的阅读对应不同层次的理解——深度阅读导致深度理解,浅显的阅读对应的必然是浅显的理解。不同需求应该对应不同的阅读层次,你可能需要快速浏览,可能需要仔细阅读,如果你的导师需要你复现论文中的细节,那么你就需要非常深入地研读。
阅读文章的三个层次:速读、精读与研读
了解了阅读的本质,那么我们应当如何阅读 paper 呢?
首先是要有“速读”的能力,快速知道一篇文章讲了什么。
其次是要“精读”。精读有两个方面:批判性阅读和创造性阅读。首先要对论文进行否定、质疑,仔细挑毛病;其次,对论文有了足够的了解之后,如果发现论文中提到的想法非常优秀,那么要创造性地思考你能用这篇论文做什么。
阅读 | 含义 |
---|---|
批判性阅读 | 要对论文进行否定、质疑,仔细挑毛病 |
创造性阅读 | 创造性地思考你能用这篇论文做什么 |
第三个步骤,我称之为“研读”,比如说自己尝试将文章中的算法实现一遍。
除了阅读的方式,读者还要理解所读的论文是怎样写出来的。一篇好的论文在逻辑上是层层递进的,不仅能够传达信息也能够激励读者。所以作者在写的时候也是有结构化的逻辑性思考程度的。总体上作者会思考:这篇论文的真实任务是什么、研究发现是什么;论文的贡献是什么等等。
相应地,读者在读论文的时候也应该要有逻辑,首先要清楚论文中的表达是否是我想要学习到的;其次,我能从论文中学到多少,能不能找到新的方向与新的课题初稿;最后,这篇论文的背景是什么——是什么样的背景让这篇论文变得重要和有趣。
无论是计算机视觉领域的文章还是泛计算机类的文章,一般来讲,都可以归为以下几类:
- 提出问题型论文
- 解决问题型论文
- 阐述和调查型论文
- 总结型论文
快速阅读:如何读标题、摘要和引言
计算机视觉领域的著名学者 Don Geman 曾经说,一篇文章可以分为标题、摘要、引言、论文主体四个部分,每一部分都需要花同样的时间进行撰写。这个说法虽然夸张但是不无道理,因为大多数读者实际上最关注的就是文章开始的两页纸。对读者而言,看完前两页就知道这篇文章是不是值得去读;对 reviewer 而言,看完开头就知道能不能拒绝这篇文章。
标题
如何读论文的标题?标题一般只有一句话。从整篇论文的排版的角度来看,在一页半的引言、四分之一页的摘要以及八页的双栏正文面前,只有一句话的标题显得不太“重要”。但是标题是总结、抽象的概括。我曾有一个重要发现:高质量的文章通常标题用两个词就能概括,并以 ing 结尾,例如 Plenoptic sampling、Lazy Snapping、Poisson matting。所以对于读者来说在读这些抽象的词或句子的时候,只有花费较多的时间才能读懂论文作者的意图。
摘要
接下来,我将介绍如何读摘要。计算机学科论文中的摘要一般有固定格式,读起来非常枯燥。所以,要读摘要的时候,将其分解并加上一些有趣的亮点,可能有利于阅读。中国学生的英语一般都不太好,虽然到了研究生阶段,思维方式可能还停留在中文思维到英文思维转换的阶段。对此,一个很好的建议是尝试把摘要翻译成中文,在这个过程当中,你会发现自己有一些细节没有领会到位,第一遍读的时候不见得读懂了。
引言
Jim Kajiya 是一个非常了不起的图形学专家,Jim曾经写过一篇文章“How to get your SIGGRAPH paper rejected”,文中最核心的观点是文章一定要写得易读——这篇论文是关于什么的?它解决了什么问题?迷人之处在哪?有什么新的东西(我一直强调做科研的终极问题就是 what’s new,写文章的时候一定要强调文章中有什么新的东西)?巧妙之处何在?
如何读论文的引言?举个例子,我最近在读《拥有伦理学:企业逻辑、硅谷与伦理学的制度化》(Owning Ethics:Corporate Logics, Silicon Valley, and the Institutionalization of Ethics),在引言部分,我问了 Kajiya 提出的那几个问题。首先这篇论文讲的是高科技公司在道德方面做了什么;其次,解决的问题是现在的实践(拥有道德)做法;文章的迷人之处在于最近的丑闻和技术后冲(techlash);这篇文章的最新之处是对 17 位科技公司的“道德拥有者”进行了采访;最后,论文的神奇之处是得出了结论:道德所有者在令人担忧的动态中运营公司。
问题 | 答案 |
---|---|
这篇论文是关于什么的? | 这篇论文讲的是高科技公司在道德方面做了什么 |
它解决了什么问题? | 解决的问题是现在的实践(拥有道德)做法 |
迷人之处在哪? | 文章的迷人之处在于最近的丑闻和技术后冲(techlash) |
有什么新的东西? | 最新之处是对 17 位科技公司的“道德拥有者”进行了采访 |
巧妙之处何在? | 论文的神奇之处是得出了结论:道德所有者在令人担忧的动态中运营公司 |
仔细阅读:从批判性阅读到创造性阅读
以批判性阅读开始,带着质疑的心态问问题。如果作者论文中声称解决了一个问题,那么你就要在心里问自己:论文是否正确、真正地解决了问题?作者论文中所用方法是否有局限性?如果所读的论文没有解决问题,那么我能解决么?我能采用比论文中更简单的方法解决么?所以,一旦进入仔细阅读的状态,要在读论文之前对自己说:这篇论文可能有问题,我要找出来。这就是批判性阅读。
批判性阅读可能非常难,也可能占用你很多的时间,早期知识储备不够时,读论文的过程中很容易卡壳。常见的建议是找熟悉这方面工作的人帮忙,让他们解释你遇到的难点。但你要意识到找人帮忙也可能遇到困难,一方面,你要找谁帮忙?另一方面,如何能让他们愉快的接受你几分钟、十几分钟、甚至接近一个小时的咨询?他们不一定有那么多时间。所以我一直鼓励大家在研究生阶段一定要跟身边导师、师兄师姐、厉害的同学们搞好关系。等到你自己成为师兄师姐后,也要积极回应学弟学妹们的提问。
除此之外,也建议你们多找一些背景知识阅读,多做笔记,多在网上搜索相关论文,然后再次通读所卡壳的论文,并试着把它与其他论文相联系起来,如此坚持下去,定能渡过难关。
掌握了批判性阅读的技巧后,如何达到创造性阅读的层次呢?这时候你要问自己:在我所读的论文中,有哪些好的 idea?(一般文章中只有一个 idea,好的文章中可能有两个 idea,最了不起的文章可以有2.5个 idea。)搞清楚作者的 idea 以后你要思考,作者有哪些点还没有想到?可以怎么改进?如果我现在做这项研究,我能做的新事情是什么?
如果说批判性阅读是“negative thinking”,那么创造性阅读就是“positive thinking”。创造性的阅读需要把你所读的论文和其他相关的论文建立联系,从而产生一些新的想法,这些想法可以支撑你进行三个月到五个月的研究。如果读到了非常好的文章,不妨写一篇半页到一页左右的 review。最好做一个口头展示,这样你会发现,只有把东西写下来或者说出来才能真正深刻理解。
理解了一个东西以后,最重要的是能够自问自答,这张图片是一个总结,图片的上半部分是比较客观的问题,包括
上半部分客观的问题 |
---|
论文的核心观点是什么? |
主要的局限性是什么? |
代码和数据是不是可得的? |
论文的贡献是否有意义? |
论文中的实验是否足够好? |
图片的下半部分是比较主观的问题,包括
下半部分主观问题 |
---|
我错过了什么相关论文么? |
这对我的工作有何帮助么? |
这是一篇值得关注的论文么? |
这个研究领域的领头人是谁呢? |
哪些公司、研究院、实验室值得关注? |
其他的人对这篇论文有何看法呢? |
如果有机会见到作者,我应该问作者什么问题? |
当你在阅读论文的时候如果能回答出上面列出的问题,我相信你会对你所读论文有非常深刻的理解。
哪些可以帮助我们的工具
我还想跟大家分享一些能够帮助阅读论文的工具,例如谷歌以及必应网页搜索引擎、谷歌学术、arXiv 等能够搜索到你想要的论文,但这些工具都不能真正帮助我们读懂 paper。在阅读的过程中,OneNote 可以帮助你做笔记;CliffsNotes 作为美国知名的学习指南网站,能够提供文献学习指南;Mendeley 是非常优秀的参考文献管理。
另外也强烈建议大家使用在线论坛讨论论文,增加学术交流,增强对所读论文的理解能力,但是遗憾的是,尚未有非常适合讨论论文的在线论坛,现在的一些社交网络产品或许很棒,但是它并不是为了学术研究目的而设计,毕竟学术论文的“非有趣性”不适合社交产品的调性。
最后,我想向大家介绍几个小 tips。我最想强调的是要养成写小总结的习惯,最好能做报告,这样真的能够增加你对所读论文的理解。我想再次强调,大家一定要有耐心,因为阅读就是在你大脑中建立认知模型的过程,虽然不知道今天读的文章未来什么时候能够派上用场,但是请大家保持阅读、建立认知的习惯。
写到这里博客已经很长了,我把华刚博士提出的带着十个问题去阅读和思考放到另一个博客。
原文链接: 沈向洋、华刚:读科研论文的三个层次、四个阶段与十个问题