闵帆教授《论文写作》心得体会

前言

本文章记录上学期参加闵帆教授《论文写作》课程的心得体会。闵帆教授在课程开始时就说过本课程的目的是教会‘论文小白’如何去完成一篇论文,这对我们研一的新生学习论文的写作是非常好的课程。通过这门课程我学习到了学术论文的写作技巧和注意事项,对我的论文写作水平有很大的提升。

学术论文概念(what、why、when、how、where)

1.what:学术论文是对研究工作的阶段性总结,单篇论文不应该强行灌水,内容也不需要太多,创新点1、2个就足够了。

2.why:格局大就是为了知识传承与学术宣传,这也是论文的初衷;对于学生来说就是为了达到毕业条件,这也是每个研究生面临最现实和棘手的问题,关乎着能否顺利毕业,每个研究生都必须早点重视;对于其他人就是为了评职称。

3.when:随时都可以,越早越好;研一下学期还不动手,研究生就很难毕业,研一上半学期就需要大量阅读论文文献,找到写论文的感觉,学习他人的思路与方法,最重要的还是找到灵感,形成自己的知识体系,最后将idea实现。论文写作的知识基础需要打牢。

4.how:第一种方法是自己通过大量阅读文献,了解作者的行文思路、学术思想、实验过程等,总结经验,最后得出属于自己的论文模板,形成自己的论文写作体系,并且在查找的论文必须是顶刊顶会的,比如AI、TPAMI、AAAI等;第二种方法就是根据别人总结的模板来写论文,在使用模板的过程中根据自己的情况调整。闵教授的课就为我们提供了模板。

5.where:论文的写作不拘泥于一个地方,当你有想法的时候,可以在任何地方家里、实验室、图书馆、地铁上、公园里。

论文写作流程

6.正常的论文写作包含三个大阶段。第一阶段是初稿,包含6个步骤:

(1)根据任务写出代码或程序并且消除bug;

(2)做实验:用图、表格等可视化展现自己的实验准备、实验过程、实验结果等关键步骤,这部分也是一些读者最先看的地方,需要简洁易懂;

(3)算法的描述:写出算法的伪代码或者流程图,并对其进行描述、解释,读者需要明白你的思路和想法,这是好文章的基础;

(4)方案描述:一张图描述实现思路过程;

(5)摘要撰写:用精炼的文字描述清楚自己的方案;

(6)引言撰写:与摘要节奏相同,需要比摘要详细,着重解释方案描述提到的图;

第二个阶段是修改,包含3个步骤:

(1)相关工作的文献综述, 含参考文献;

(2)理论基础、符号表;

(3)对比实验, 很可能涉及重新实现、运行别人的算法;

(4)消融实验;

(5)实验的图形展示;

第三个阶段是检查与打磨:前期还是注意不要乱写, 把小问题全堆到这个阶段不好. 如果文字很差, 也影响前期的交流。

常见的Latex模板

7.每个期刊都有各自的格式文件,如果我们去依次寻找并且通过word排版就很麻烦,可以通过Latce代码来进行排版,可以通过简单的代码实现对格式进行调整和实现一些表格,图像等,能够大大提高写作的效率。寻找Latex模板的基本准则:最好找该期刊已录用论文的源文件. 本贴将给出几个例子,其次找该期刊提供的模板文件。

如何正确使用单词短语

8.基本原则是未出现在任何学术论文在的单词不可以使用。在正式论文中几个单词的缩写也是有严格要求的,比如在正式论文中Have’t 与 Don’t,应使用 have not, do not, cannot 之类. 仅当 authors’ 之类的情况, 才使用撇号。

9.一些单词的滥用比如and,and这个单词禁止在句子的开头使用,它出现在句子的开头没有任何意义,反而给人一种不连贯的感觉;在句子之中也要尽量少使用and,and表示的两者的语义并列,但是初学者很难分辨清两者之间是否存在并列关系,而且因为相邻的句子本身就有相关性,没必要去使用它。

10.一些不够严谨的单词也不能使用,比如easy、simple、solve、prove等,学术论文提出的是一种新的方法或者思路,肯定具有一定的难度,不能用easy、simple等词语来形容,如果一个东西简单,大家也没有研究它的必要;solve的意思是解决,这个单词的分量太重了,我们这个阶段或者涉及的领域比如机器学习、安全、图像识别等还不能解决某个问题,只是提出了一种改进方案、新思路,所以应该用handle 或 address,只有我们彻底解决某个数学难题, 写出了相应的定理与证明, 才能说 solve;实验结果只能表明 (show) 而不能证明 (prove) 某个规律, 如你的结果比别人的好. 仅当你写了定理、性质及其证明过程, 才能说 prove。

11.其它注意:把 only 放到一个尽可能靠后的位置. 如: 使用 consider only uniform distribution 而不是 only consider uniform distribution. 前者表示你仅考虑了均匀分布, 对其它分布有能力研究, 只是暂时没做而已. 而后者表示你怂。使用 https://www.linggle.com 查看单词或词汇的使用频率. 例如: related work 有 415,960 次匹配, 而 related works 只有 46,757 次, 一般情况写成前者。

怎样将好的中文变为好的英文

12.写出一个好句子有两个办法:借鉴法和倒腾法。

借鉴法:找 20 篇顶刊的论文. 一般不用顶会的论文, 有的作者急于投稿, 没来得及打磨,然后找出各个部分的简单句子, 如: The main idea is to estimate the total energy consumption by summing the energy contributions of each instruction.获得句型, 如: The main idea is to … by …,最后在自己的论文中使用。

倒腾法:首先需要写一个表达清楚自己意思的英文句子,然后使用 https://translate.google.cn/ 翻译成中文句子,再翻译成英文句子,直到中文句子和英文句子都不再改变 (即收敛)最后将句子中的非专业词汇换成正确的专业词汇。

13.在使用借鉴法的时候需要注意应按句子出现的位置 (摘要、实验) 来分别总结, 它们有不同的时态和味道;复杂的句式 (带多个从句) 不要学,最好一个从句都没有,主谓宾最开心;再使用倒腾法时最好从英语句子开始, 而不是中文句子. 否则更难收敛;如果收敛后的句子与开始的句子相差太大, 而且并不能表达你的意思, 就需要根据前者来修改后者。

14.两种方法都有各自的优缺点,借鉴法的优点在于模仿或者使用的语句基本上不会有什么错误,都是在别人的基础上产生的,越写越有经验,对于英文的写作也更加自信;缺点在于前期需要大量阅读文献并且提取需要的句子,有一个积累的过程,这一阶段比较痛苦,但坚持下来就轻松了。倒腾法的优点是按照自己的想法写更容易找出一些潜在的问题,也不用积累太多的句子;缺点是我们的中文表达不清楚,英文的表达也更加不清楚了。

正确表示符号和数学表达式

15.首先如果公式过多,需要总结一个符号表,但是这里面也有很多需要注意的地方;不要对式子、符号进行额外的处理;必须使用Latex对数学表达式进行处理,不能使用word;不同字体的同一个字母表示不同的涵义. 如 x \mathbf{x}x, x xx, x 是三个完全不同的符号. 因此, 应检查符号系统的一致性;

16.数学式子是句子的一部分, 因此它们应该有相应的逗号、分号、句号. 如果使用逗号, 后面的 where 应该顶格写, 以表示在同一行. 还应以小写开头, 表示是句子的后面部分。集合、数组、向量应使用粗体. 如 X \mathbf{X}X (源码 $\mathbf{X}$) 或 X \bm{X}X (源码 $\bm{X}$)。

脱颖而出的题目

17.题目必须要有吸引力,展现文章的创新点,对于计算机的论文来说题目应该点出自己提出的新方法和新方法,新的问题应该有意义而且有挑战性新方法则应该高效或准确。不炫的题目没人看,但是题目也不能过于炫,会让读者有种被蔑视的感觉,这样是吸引不了读者的,其次标题中的术语和缩写应该易于理解,读者不需要借助字典能理解的词语。可以适当使用through, with 等来表示技术。

18.题目的长度也有一定的要求,过长的标题表示你的新方法或者新思路存在的限制较多,范围很窄,创新性也比较低,读者的兴趣不高,觉得没有读的必要;过短的标题说明创新性很高,但是不是本博客读者所能达到的水平,如rough sets, fuzzy sets 等。中文的‘基于’和英文的‘based on’是不能出现在论文标题中的,因为这两个词会让读者误以为你是基于某个技术上研发或者简单应用的,对读者的吸引力不大。

19.不应该使用过于高大上,过于生僻,在我们生活中不常用的词作为标题,流行的、常用的词有助于被其他人搜索到,也能帮助提高论文的被引频次. 对于一个学者而言, 论文引用次数比论文数量更重要。如果题目出现了算法,题目的缩写就应该为算法的名称。

关键的摘要

20.摘要又称概要、内容提要,意思是摘录要点或摘录下来的要点。 摘要是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。摘要主要包括三个部分:已有的工作评述,本文工作的描述,实验结果。部分期刊明确要求按照 Background, contribution, experiments 三个方面描述。

21.首先我们需要说明问题所属的领域,简要带过背景,解释最重要的概念,或者强调问题的重要性,对于important这样的词要少用,太广泛了,被滥用了,任何论文都可以说自己的问题important,然后就可以说明在本文之前其他人的工作,别人是怎么做的,而本文有什么改进或者提出了什么新方法;再说明前人方法的局限性,可以和上一步写一起,就是为了引出自己的方法,要尊重别人的成果,也要自信的表达自己的观点;本文工作需要是对题目的进一步阐述和扩展,可以超过20个单词,本文方法应该至少提出三个技术使用,保证工作量,最后给出实验结果,对什么问题做出了什么贡献,可以吹嘘论文的意义。

精炼的keyword

21.关键词源于英文“keyword”,特指单个论文作者在制作使用索引时,所用到的词汇,关键词是论文索引主要方法之一。首先关键词一般需要3-5个,一个关键词一般有1-3个单词,关键词不能太长,太长容易影响读者的阅读,而且关键词的作用是摘要的一种补充,不宜太多;关键词的排序应该按字母排序。有些期刊有特定的关键词列表,需要从其中选择,作者也可以添加自己的关键词。

引述

22.论文的引言,也称为“导言”序言“”。通常置于论文前面,对论文所涉及的研究进行初步的介绍,通常是一段或数段短文。引文非常的重要,很多审稿人在读完引言后, 就有了基本 (80% 以上) 的判断. 如果引言写得漂亮, 他就会在后面的正文中找出一些证据, 赞扬研究工作有意义, 理论完备, 实验效果好等等,如果写的难看,审稿人随便找几个问题就pass了,通俗地讲,论文的引言就是论文的开场白。有一个死板的方法就是采用和摘要相同的格式,摘要中的每一句都可以扩充成引言中的部分。

23.引言的层次也非产重要,引言必须保证单词上没有拼写,句子上没有语法错误,高维度上同一件事情可以从不同角度描述正面反面描述等,每个意思表达简洁、得体、有吸引力,不能说重复的意思,容易引起读者的反感。

文献简述的模板

24.每篇论文都应有文献综述,绝大多数的参考文献应在文献综述中引用,主要是为了让读者不懂是方便查阅。文献简述可以在不同的地方描述,可以在引言中,在实验之后,在Introduction 和 Related work 应该统一布局, 而不能相互打架;参考文献不能成为简述的主角,表达一个完整的意思后,再把文献的引用加上去,同时也不能让参考文献称为句子的主语、宾语,不能反客为主;不能引用太多文献,也不得全局引用;最后还是那句话要尊重别人的成果,客观的指出不足,说明自己的创新。

写好算法的伪代码

25.伪代码(Pseudocode)是一种非正式的,类似于英语结构的,用于描述模块结构图的语言。伪代码是论文的核心之一,需要说明输入、输出;方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;需要写出主要步骤的注释;长度控制在 15-30 行;可使用数学式子或对已有数学式子的引用;不重要的步骤可以省略;一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准。

论文最重要的部分实验

26.对于机器学习的论文,实验部分占据了一半篇幅,数据集越多、越广、数据集越大结果就越可信,实验的主要目的是回答一些作者和读者关心的问题. 因此, 我采用自问自答的方式, 在实验之前提出这些问题, 在实验结果列出之后逐个回答它们。可以进行内部比较和外部比较,内部比较只要是表现得是一些参数得变化对性能得影响,并且选择效果最好得参数,还可以展示主要方案和其他变种得优势;外部比较就是和现有得方法比较,需要和最先进,最好得方案比较,通过图表表示是一个比较好的办法,清晰有辨识度,有图得同时还要附上文字解释,让读者理解得更透彻。

结论和展望的艺术

27.结论也是论文很重要得部分,读者最先关注的就是开头和结尾,所以结论和展望的写作需要一定的艺术。首先结论不能太长,5句话就够了,其次避免与摘要重复,摘要展示的是我们做了什么事情,结论展示的是我们的成果,结论比摘要更加具体. 可以具体到论文中的某个算法, 某条性质, 某个定理, 某个实验结果, 这样就自然与摘要区别开来。

28.展望作为读者可能非常关注这方面的内容,因为他们可以在你的思路基础上进行研究,如果我们写好了一个展望,可能会让读者的思路更广泛,就会有很多引用,引用的数量比论文数量更重要。

漂亮的图片

29.尽可能使用矢量图. 这样在放大的时候就不会失真. 除画图这种低级工具之外, visio, matlab, python 生成的图都可以存为矢量图。围绕图的说明性文字应该比较长. 它占的版面应不低于图片本身版本的 1/2, 当然也可以是两倍。文字比较长, 排版更容易。保证你的彩图在黑白模式下也能表达你的意思,这是需要被考虑的地方。一幅图胜过千言万语,把图画漂亮是硕士毕业的必要条件。

不可原谅的低级错误

30.指的是一些低级错误,但又非常的普遍还是需要重点强调。必须注意大小写,特别是参考文献作者的名字,首字母大写;标点符号前不能有空格,小括号前不能少空格,参考文献引用的方括号前必须有空格;符号应规范, 且保持同一篇论文中的一致性,严格禁止使用 Word 的公式编辑器写式子, 然后转到 Latex 源文件; 重复的标签一个标签被两个地方 (如两张图) 使用, 这是拷贝后没修改导致的. 有时两篇参考文献的标签也会重. 缺失的标签有 \ref 但没有相应的 \label;避免出现长句和不完整的句子;矢量图,未使用矢量图视为错误. 放大后看起来是马赛克, 流程图未按标准画的流程图视为错误. 自己回本科学。

如何避免被花式拒稿

31.首先文字必须规范,包括单复数、时态语态、有无主语谓语等问题,其次是实验相关的,上文也强调了,实验的数据集要多,要广,要大,实验对比的算法要多,算法先进,不能太古老,自己提出的算法的性能要远优于老算法,然后就是挖坑要埋,自问要自答,符号系统必须一致,最后也是我认为最重要创新要足够,产生算法的动机要足够。

总结

通过半学期的学习让我学到了很多论文写作的方法。要想写好论文,在学习了闵帆教授的课程之后还需自己去尝试,在实践中发现问题,结合课程所讲的知识解决问题,能让我们在论文上走很少的弯路,最后感谢闵帆教授的无私奉献和悉心指导。

  • 3
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值