《学术研究你的成功之道》读书笔记之论文篇

《学术研究你的成功之道》读书笔记之论文篇

五年前的一次机器学习会议上,正逢凌晓峰教授签名出售新书《学术研究你的成功之道》,心血来潮买了一本,翻了一下觉得写得很不错。近日由于要在组会上介绍论文写作方法,想起了这本书,又重新拜读了一遍,收获颇丰。

本书出自人工智能领域的两位顶尖学者凌晓峰教授和杨强教授之手,全书分为八个章节,如下:

  • 第1章 研究的本质
  • 第2章 博士生的终极目标
  • 第3章 迈出第一步:挖掘新想法,制定总规划
  • 第4章 严谨做研究
  • 第5章 撰写与发表论文
  • 第6章 论文写作中的误区和技巧
  • 第7章 撰写毕业论文与论文答辩
  • 第8章 博士之后,路在何方?

本次学习主要了解第5、6章学术论文写作相关内容,把重要的地方做了笔记。

第5章撰写与发表论文

优秀的论文怎么定义?

一篇论文的影响力评价标准之“被引用次数”,是指其他研究者在其工作中提到或参考了相关研究论文的次数。
- 科学引文索引(SCI),只计算被期刊论文引用的次数。
- Google Scholar,CiteSeerX,同时计算被期刊和开放性出版物(如会议论文)引用的次数。

一篇论文的影响力评价标准之“h因子或h指数(h-index)”
用来评估某一研究者或者单位、院校整体论文发表的质与量。
比如,某研究者的h指数是17,表明他已发表的论文中,被引用了17次的论文共有17篇,而剩下的论文被引次数都不超过17.
这里写图片描述

而对于准备投稿的论文来说,可以对照评审打分表来检验论文的好坏。一般评审会从以下四个方面来对一篇文稿进行打分。

  1. 研究工作和实验结果是否新颖?
  2. 实验结果是否具有影响力?
  3. 论文所用技术方法是否正确可行?
  4. 论文书写手否清楚明白?

一般来说,评审首要考虑前两点,即研究工作的新颖性和影响力。如果前三点得分低,写的再好也没用。如果写的不清楚,评审会对前三点产生质疑,从而降低打分。

学术论文写作的基本常识

  • 学术论文的内容必须真实、可信、准确。(最重要)
  • 研究论文必须尽可能详细地讲述研究工作。
  • 具备可重复性和可验证性的实验结果。
  • 切忌“抄袭和剽窃”,这里的抄袭和剽窃,主要强调两种表现形式。一种是“引用抄袭”,阐述自己的研究工作时,没有引用和评价与此相同或相似的现有工作,给读者带来此项工作是作者首创的印象。另一种是“一稿多投”,将相同或相似的研究内容写成多篇论文投递给不同的会议或期刊,这是学术不端,说严重点,属于学术欺诈。

作者的选择和排序

第一种,按姓氏的字母序排序,理论科学和数学领域较多采用
第二种,按作者的贡献大小排序

  • 研究问题和研究方法的提出者贡献最大
  • 研究问题和研究方法进行论证、实现和实验的人贡献次之
  • 论文撰写者第三
  • 支持研究工作得以顺利进行的经费提供者贡献也相当大,但对某篇论文的直接贡献可能相对小些

第三种,学生在前,导师(通讯作者)在后,其他参与者在中间,这种较常用


第6章论文写作中的误区和技巧

“通病式”误区:没有向读者展示一个强有力的逻辑论证

与语言无关,母语为英语的人也会犯。一篇论文实际上是一个逻辑论证。
逻辑论证的中心主题:研究工作的新颖性和影响力
逻辑论证步骤:

  1. 研究问题对推动科学和工程知识的发展很重要
  2. 现有工作A,B,….已完成….方面的工作,但这些方法还存在一定的缺点
  3. 提出了一个新的理论/方法/设计/过程Z。(强调Z的新颖性,是第一次提出来吗?能带来什么影响?)
  4. 相比较于A,B和其他,我们能够证明/示范Z具有更强的优势(至少在某些方面)。(理论证明,实验证明)
  5. 对Z的优点和缺点都要进行讨论。(客观分析,弱点也可能是未来工作,通常出现在论文的结论部分)

当你强调所研究问题的重要性时,可以在论文中指出过去曾有研究者阐述过这个问题的重要性,并且引用多篇关于此研究问题的应用类型的文章,或者说明这个问题能够对现实世界中的设计问题、工程问题和一些应用产生影响。

当你在论文中强调自己提出的新理论或者新方法比现有方法好时,应该能够给出理论证明,或者足够数量的实验,通过数字进行比较。与此同时,对结果进行统计学的显著性检验。如果你在论文中说明你的新方法已经在现实世界中得以应用,例如已将研究工作成功部署于工业应用,这样会更加有利于论文论点的证明。

总之,论点有越多的论据来支持,越有说服力,论文将有越高的录用机会

如果你非常肯定论文中提出的新理论、新范例或者新方法,你是第一个,那么应该在论文中如此表述:
“To the best of our knowledge, we are the first to propose …”
“To the best of our knowledge, our work is original…”
使用主动式句子结构来描述你的研究工作
(we propose…; we demonstrate…)
如果使用被动式句子结构(it was proposed…),可能导致读者弄不清这个方法究竟是谁提出的

千万不能夸大你的研究工作
评审中,经常看到“我是最棒的”,作者却没意识到如此阐述是不对的。
做蠢事,陈述非常“重量级”的观点(比如“我们已经完全解决了人工智能的问题”),但是论文中却完全找不到证明这句话的半点证据。会给评审留下极其恶劣的印象,这种论文是不可能录用的。

礼貌用语
对读者要尊敬,比如“to the best of our knowledge, as far as we know”
讨论现有工作不足时,语气要委婉,比如“it seems that the previous work …”

误区:“读懂我的论文是你(审稿人)的责任”

文章越难懂,越能代表作者水平高×
文章尽可能书写得清楚简单√

10/30检测法——检查论文是否书写的清楚明白

10分钟内搞清楚你的研究问题是什么,研究工作的主要贡献是什么。
30分钟内理解你的研究工作,包括方法和流程等,并作出录用或拒收的决定。

自上而下的写作方法

这里写图片描述

标题——对研究工作进行高度总结,不会涉及太多技术细节,同时要传达一个令人兴奋的信息,如“改善”、“新颖”、热点议题的词语。
基本原则:

  • 强调中心主题
  • 醒目,吸引人
  • 最好不要超过一行
  • 没人用过(搜索)

摘要——对中心论点在高层面上的完整的概括性描述,不使用任何技术术语。
基本原则:

  • “200字的故事”、“电梯演讲”
  • 积极兴奋的语调
  • 新颖性和影响力

引言——对研究工作的高层次介绍,重申论文的中心主题,论点的每一部分需要更多的解释说明。
基本原则:

  • 1~4页,平均2页
  • 自上而下的细化
  • 尽量回避技术术语细节
  • 摘要的每个句子扩展成3~20句话便构成了引言的论点(20个句子可以成段)

引言的最后会介绍论文的结构安排,尽量使用主动语态
比如:
We organize the rest of the paper as follows. In Section 2, we discuss previous work on … In Section 3 we describe …. Finally, in Section 4 we show … etc.

相关工作——对引言相应内容的更详细阐述,向读者展示你已对经典算法有了很深的认识和理解。
基本原则:

  • 一节篇幅
  • 指出你所提工作和现有工作的差异

你的研究工作——描述你的原创性工作,是论文的核心和重点。
基本原则:

  • 篇幅长,展开数个章节
  • 详细阐述
  • 自上而下细化
  • 注意层次结构的划分

结论——再次高层次总结,类似于摘要,但需更细致的说明研究工作的新颖性和影响力,还可以对未来工作进行简要描述。

论文写作技巧

使用特定词语来提示读者

阐述技术细节时
“More specifically, …”(具体地说,……)
“For example, …” (举例来说,……)
“We provide details of Step 3 as follows …” (第三步的详细描述如下……)
“Below we give a detailed breakdown of our experiment results” (下面我们将对实验结果进行详细分析)

通篇使用少量且一致性的术语

比如,X表示一个矩阵,就要通篇用到底, 不能中途换成M表示同一矩阵
一个概念多种表达方式不能交替使用,比如:
测试集上的准确率(precision on test data)
precision on testing data/precision on validation set/test-set precision/percent of correct retrieval on test set

尽早使用实例,贯穿全文

讲故事:当需要对论文中抽象的概念,复杂的理论,繁琐的建模过程进行解释说明时,最好借用一个生动形象的例子来帮助理解,避免评审者迷失在一堆符号和定义中。
随着研究工作描述的展开,你的“故事情节”也在发展。

视觉化表达

有图有真相 ,无需吝啬
图表、流程图、图片、图形、图画、插图、表格等

写清动机,解释论证

站在读者的角度写论文
长篇大论前先交代研究动机
回想一下最初的研究动机,试着讲给不太了解该问题的同事听
研究过程中,时刻记录每个阶段的研究动机
解释论证研究中作出的一些重要选择
比如实验和数据中为什么要选择那些特殊参数?为什么你只对过程中的某几部进行了合并而其他步骤没有合并进去?
如果没有解释,评审者会对研究工作怀疑,甚至产生负面的评审意见

自问自答

阅读自己论文时,将最可能产生疑问的地方做标记
比如“One might wonder…(有人可能会想…)”,“One might argue that…(有人可能会质疑…)”,引导读者向作者思维靠拢
如果你自问之处恰是评审者疑问的地方,那么紧随其后让人满意的答案会为论文增色不少。

多次强调关键点

如果有些语句传达的信息非常重要,建议在论文中,尤其是高层面的章节,重申多次
除了语言形式,还可以采用图形、列表、标题等多方面描述

前呼后应

恰到好处的连接词可以将论文的各个部分连接成一个整体
比如,“详见…章节” ,“我们曾在第…节讨论过” ,“回想…”

论文格式

评审中令人恼火的几件事:

  • 图图形、图表和相应的文字说明不在同一页(LaTeX排版时经常发生,需要手动调到位置尽可能接近)
  • 不给图表加标题,要到文中去找相应的文字叙述
  • 图表文字太小,以至于看不清
  • 图表内填充了过量的信息,不知从哪看起

中国学者在论文的英文写作方面易犯的错误

丢失冠词a(an), the

文字第一次提到这个名词时,加上不定冠词“a(an)”,而后再提到该名词时,应加上定冠词“the”。
“In this paper, we propose a novel algorithm…. The algorithm is based on…”
当名词需要用到复数时,比如在相关工作介绍部分要描述一些现有的研究状况,方法或模型,如果这些描述是特指的,要叫上定冠词“the”做修饰
“…different from above-mentioned technique,…”应该写成
“…different from the above-mentioned technique,…”
如果是抽象名词、复数或者名词出现在标题、章节小标题中,可免去冠词 。

表达不精确

“就我们所知,目前针对这一问题所发表的研究论文并不多”
“To our best knowledge, a few papers have been published on this problem previously”,其中“a few” 表示“有一些”,可以改为“only a few”或干脆“few”
动词表达要准确,避免太过宽泛、高频的动词“do”,“take”等,比如“做实验” ,“conduct experiment”不要写成“do experiment”
用词坚定有力,不能模棱两可,比如
“To the best of our knowledge, this is the first time that a problem of this complexity is solved”

中式英语
非正常断句

在完整的句子后面使用逗号,在中文中行得通,但在英文中属于语法错误。
“I walk, she drives.”×
“I walk; She drives.”√
“I walk, but she drives.”√
“Most researchers claim that…, they are not correct.”×

非正规写法

切忌口语式表达,非正规用词
“It doesn’t make very much sense.” ×
“We find the probability isn’t zero.”×
“old methods”×
“Our approach beats their methods.”×
“It does not make sense.” √
“We find that the probability is not zero.”√
“previous methods”√
“Our approach outperforms their methods.”√

非正规缩写

“We proposed a potential field-based coverage enhancing algorithm (PFCEA).”
“PFCEA” 读起来拗口,不够简短,可以考虑加入辅音后面的元音字母,改为“PofCea”
Algorithm前面修饰语太多,造成混乱,可改为“We proposed a coverage enhancing algorithm (CEA) based on potential field.”

非句子的组成部分

英文写作中没有冒号后面接完整句子的写法,比如
“We list as follows: 1…. 2….”
正确写法是“We list as follows. First, … Second …”
除了论文标题和章节标题外,完整的一句话才是文章的基本组成元素。

太多花哨的格式

学术论文不是大字报,切忌使用太多黑体、斜体、下划线、单词首字母大写等样式。
比如“machine learning”首字母完全没必要大写

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值