闵帆老师论文写作心得

目录

写作前的准备

写作工具

写作注意事项

词汇

语法

符号系统与数学表达式

论文内容

标题

摘要

关键词

引言

文献综述

理论部分

算法伪代码

实验部分

数据集

参数设置

实验结果

结论

参考文献

图表

审稿意见的回复

总结


写作前的准备

我们写论文不是突发奇想的,实际上论文是在研究工作已经做了很大一部分之后,对自己的研究工作进行文字性的总结描述。我们写论文一定不是重复他人的工作,而是有自己的创新或者和他人有区别。创新实际上不要求“前无古人”,我们可以在前人的基础上做出改进,有一定的原创性即可。

论文写作还需明确写什么,这就需要我们平时多看多积累。多阅读顶刊和顶会上与我们专业相关的论文对启发我们思考有很大的帮助,我们思维不够活跃很有可能就是见的不多,思维被局限住了。当我们从中受到启发后,还需要调研当前方向是否可行。方向热门不见得能写出好的文章,但是方向小众也不一定不能写出成功的文章。

论文写作不是一蹴而就的,不可能一次就能到位。“好论文是改出来的”,实际上是一个迭代的过程,如果第一版写的较好,可能迭代次数较少就能得到一篇好的文章;反之就可能需要反复修改多次才能得到一篇符合要求的文章。迭代的过程需要修改意见,可以找到与自己同方向的师兄师姐或者导师,甚至修改到一定程度投递出去由审稿人给出修改意见。总体来说,是一个不断优化的过程。

写作工具

“工欲善其事,必先利其器”,论文写作首先需要一个趁手舒适的工具。虽然word也能用来写作,但是word相较于latex,latex如果找好模板的话,不用自己调整格式,书写公式计算,插画图片表格,引入等都是比较方便的。很多期刊都会给出模板,我们就不需要重头到尾的书写而是将内容填充至对应的位置即可。在实际使用中,latex的最大优势就是可以节省我们排版的时间。

写作注意事项

词汇

论文写作具有一定的规范要求,就用词以及用词形式而言如下:

(1)不使用简写,如don't、can't等,需要使用完整的形式,如do not、cannot。存在authors'之类的情况才使用撇号。

(2)and

禁止在句首出现and,and出现在句首并无什么实际意义,并且会使读者在阅读时打断其思绪;在句中也要慎用and,除非是对仗工整的词组。根据中文思维而言,我们在写到并列词组时会很习惯的使用and,因此在正式写作时一定要有意避开这一问题。

(3)easy、simple

不使用easy,若研究工作可以使用easy进行评价,那我们的研究工作是没有太大意义的。simple在语义上与easy类似,因此一般情况下也不使用,但如果我们的研究工作simple yet effective就可以使用。

(4)solve

只有我们彻底解决了某个数学难题,写出了相应的定理与证明,才能说solve。机器学习一般无法解决某个问题使用handle或address即可。

(5)novel

novel指前所未有的新,当我们一定要强调某个事物从来没见过时就用novel。这一词过于夸张,当审稿人看见这一词时,会对论文抱有较高的期待,若是没有达到其预期,相对是减分的,很有可能被拒。一般情况我们使用new即可。

(6)only

only的使用位置也有大学问,使用only时可能本身就表示了研究工作的局限性,使用位置的不同会给读者带来不一样的感觉。如consider only uniform distribution 与only consider uniform distribution这两者从感觉上来说是不一样的。

(7)prove

实验结果只能show而不能prove某个规律,它只能表明你的结果比其他人的结果要好。只有当我们写了定理、性质及其证明过程,才能说prove。

(8)用词要保持一致

当我们写英语作文时,有一个重要思想是“中文重重复,英文重替换”,这样写出来的文章才会获得高分,但是当我们写论文时,要求同一概念在全文不同地方的表达形式要统一,不能有多个版本。当我们同一意思的表达形式过多时,需要读者去自行领悟,这是很不友好的。

(9)避免使用俚语

俚语往往代表的含义与字面意思是不同的,这就需要读者还有相应的文化背景,是非常不友好的。

(10)其他

我们拿捏不准词汇是否正确时,可以在 https://www.linggle.com 查看单词或词汇的使用频率,我们使用高频词汇即可。

语法

论文写作实际上考查的是逻辑能力,使用中文或者英文都只是一种形式,就如同写代码一样,我们有了正确的算法后使用c、c++、java或是Python来写最后都能实现目的。现在的翻译软件非常成熟,使用中文而后翻译成英文也是可以的,但前提是中文逻辑正确不存在语法问题。写出好的句子主要有两种方法:

(1)借鉴法

在顶刊的多篇论文中进行借鉴学习并总结一些常用的句式,放置在对应位置使用。需要注意的是句子出现的位置,并且不要学习复杂的句式,具有完整的主谓宾即可。这种方法虽然开始需要消耗大量时间进行总结,但后续书写的句子没有语法错误并且速度会越来越快。

(2)倒腾法

实际上是在英文和中文中不断倒腾,直到无论如何翻译中文和英文都不再发生变化(收敛)。最好是从英文开始,否则很难收敛。英文和中文互相翻译的过程中很有可能面目全非,就需要对原始句子进行修改。这种方法很大程度上取决于原始句子的好坏,若原始句子不好花费大量的时间也不能得到一个好的句子。但这种方法几乎不需要准备时间可以完全按照自己的意思写。

总的来说,更推荐初学者使用借鉴法,因为很多人实际上并不能将原始句子写成逻辑正确语法没有错误的句子。

符号系统与数学表达式

对于我们专业而言,符号表达和数学推导是必不可少的。在论文中涉及的符号需要先给出定义,方便读者查阅。需要注意的是:

(1)不要对符号进行多余的处理,如强增空格、花括号等。

(2)数学表达式应该直接在latex中编辑而不是在公式编辑器中编辑后粘贴到latex中,这种方式很容易出现(1)中的问题。

(3)需要注意(变量)标量和向量的区别,(变量)标量一般是斜体,常数和运算符是正体,但在latex中不需过于担心,直接将整个数学表达式用$括起来即可。向量应该使用粗体,在latex中使用代码控制—— $\mathbf{ }$或$\bm{ }$。

(4)同一字母的不同字体可以表示不同的含义,因此使用时需要检查一致性。

(5)给数学表达式编号、数学表达式过长需要切分在latex中都有代码进行控制,按照实际需求合理使用。

(6)数学表达式若放置在句子中,也应该遵循句子的格式具有标点符号。如果使用逗号,后续句子应该顶格小写,以表示仍然在同一行并是句子的后面部分。

论文内容

论文由标题、摘要、目录、引言、正文、结论、致谢和参考文献八个部分组成。下面将依次介绍如何书写对应部分。

标题

论文的标题至关重要,是读者第一眼就能看到的东西。论文的标题需要具有吸引力,否则读者将不会有阅读兴趣。标题还需要易于理解、易于检索,在起标题时不宜使用过于生僻但能准确表达自己研究内容的词汇。标题长度也有一定的要求,不宜过长,过长说明有很多限制条件,代表研究内容可适用的范围比较小,创新性就比较低;同时也不能太短,太短可能不能准确表达研究内容,越短就代表创新性越高。标题字数一般在40-60个字母之间。标题一般不使用based on,基于一个现有方法的简单扩展读者会认为创新性不高,会影响读者的阅读兴趣。如果主要贡献为算法, 题目的缩写就应该为算法的名称。

摘要

摘要是对论文重点的摘录,许多读者点进论文后会首先阅读摘要,如果摘要对他们的研究工作有参考意义可能才会继续阅读。通常包括三个方面:已有工作的评述、本文工作的描述、实验结果。根据闵老师总结的模板来看,摘要十句即可。第一句说明问题及其重要性,也就是说明我们的研究工作的重要性;第二句说明已有工作,也就是现今该研究领域已经做过什么工作了;第三句说明已有工作的局限性,已有工作的局限性应该是我们研究工作可以解决的,但是我们不能对他人的工作过于贬低,要客观公正;第四句说明本文工作,需要说明我们的研究工作是什么,是对题目的扩写;第五到七句应该分别说明本文工作的一个优势或者贡献,这也是说明我们相对于已有工作的优势或者解决已有工作局限性的句子;第八句说明本文中的实验设置,包括数据所在领域、来源和数量等;第九句说明本文的实验结果,比如相较已有工作的效率或者准确率的提升;最后一句说明论文的意义。

按照十句模板来写就是一个合格的摘要。

关键词

关键词与题目一样,也可以作为检索的条件,因此关键词也非常重要。关键词是对论文总结后提炼出来的,一般是三到五个,每个关键词由一到三个单词构成,关键词的顺序需要按照首单词的首字母字母表顺序排列。

引言

引言需要像讲故事一样将整个研究过程叙述出来。一种是将摘要扩写,将摘要的每一句扩写成完整的一段,每段五到十句。每段过长过短都是不合时宜的,长则拆分,短则合并,保证每段在50到150个单词。

第二种是绘制一张图,围绕着图说明问题,图与文字相比是非常直观的但这对图的要求比较高,可以在图中清楚的表明核心技术、算法框架、小的运行实例、效果对比等等。

在写论文时不需过分炫耀自己的语法能力,采用简洁有力的句子即可。引言的节奏可以与摘要的节奏一致。

文献综述

大部分文献都应该在文献综述中被引用。文献综述说明的是作者对相关工作的调查研究以及总结。应该客观陈述,可以书写在不同的地方,若在引言中书写会较为简略;若专门使用一节进行书写会详细一些;还可以在试验之后再书写。但应该统一布局,不能打架。文献综述通常不按照时间书写,按照时间堆砌会比较没有逻辑感,可以分门别类进行介绍,大类套小类,这样逻辑会比较明确。

文献综述不是将文献简单罗列,也需要有自己的观点。避免将参考文献的引用作为句子的主语、宾语等,这样会失去自己的观点。不能照抄参考文献的原句,一方面查重会出现问题,另一方面容易出现学术不端的问题,若一定要全句引用需套上双引号。

在文献综述中还需要评价相关工作的优缺点,措辞需要客观,不能过于贬低他人的工作,可以不吝夸奖。文献综述可以引用自己的文章。对于相互之间没有过多联系的参考文献,可以按照分类在对应位置书写,而不强抓参考文献之间的逻辑关系。

理论部分

在正文中不可避免的会需要对概念下定义或者进行数学推导,这一部分是比较困难的,因为我们可能对一个概念的运用十分熟悉但如何下定义却是比较陌生的,这十分考验数学功底。对于定义有以下几点要求:

(1)定义需要没有歧义;

(2)符号系统要保持同一风格;

(3)逻辑关系要正确。

这一部分是我们日常不容易接触到的,我们可以多看一些好论文是如何对概念下定义或者说明公式定理的,多阅读的同时多尝试,尝试自己对一些概念下定义或用数学语言说明一些公式定理。

算法伪代码

对于我们研究工作中涉及的算法仅靠文字说明是不够直观的,这个时候就需要算法伪代码。

(1)算法伪代码与代码一样,需要明确输入和输出。

(2)算法伪代码同样需要写注释,可以方便读者阅读。

(3)算法伪代码中涉及的某些方法若是我们熟知的,可以不用写出如何具体实现,仅写方法名即可,也就是说伪代码中不重要的部分可以省略。。如swap(a,b),从字面上即可知道是交换a、b的值,因此不必写出具体是如何交换的。另外伪代码中涉及的方法名可写可不写,如果会被别的方法调用就必须写。

(4)伪代码不仅局限在使用代码语言书写,甚至可以是句子。

(5)长度需要控制在15到30行。过长说明伪代码书写过于详细,可能会与源代码没有过多区别;过短可能问题不能得到清楚的描述。

(6)可以使用数学表达式或者对上文出现的数学表达式的引用。这也是为了更好的说明当前步骤是如何实现的。

(7)最后对时间、空间复杂度分析,可以使读者更好的看出本文算法的性能好坏。

实验部分

实验部分中需要说明实验数据来源、实验参数设置和实验结果等。这一部分通常会占据论文一半的篇幅。实验部分可以采取自问自答的模式进行书写,在实验这一节开始提出问题,然后在列出图表后依次回答这些问题。

数据集

研究工作的成功与否不仅与研究方法有关,还与实验数据来源有关。实验数据应该尽可能的多并且覆盖的领域广,这样的数据做出来的结果才有说服力。实验数据如果很少很有可能会出现过拟合现象,若实验数据确实不够丰富那么我们可以采取数据增强技术增强数据集。实验数据集若覆盖的领域很窄,那么很难说明我们的研究方法适用的领域广,会使读者觉得我们研究方法适用领域很窄。

当我们获取数据集时,不仅仅考虑数据量和数据领域,我们还可以采取参考文献中涉及的数据集。这样的话可以省去我们很多工作,当我们需要对比时,可以不用再复现一遍参考文献中的方法而直接使用参考文献中的数据进行对比即可。

在这一部分可以使用图表直观说明数据集中各个参数所代表的含义。

参数设置

在实验部分还需要说明研究工作中主要的参数是如何设置的,以神经网络为例,我们需要说明神经网络中各个超参是如何设置的,如学习率、批大小、迭代次数等等。

实验结果

实验结果不仅仅要展示我们研究方法的实验结果,还应该展示不同参数下或者研究方法的变种的实验结果,以及与其他的研究方法进行对比,这样才能更好地说明我们研究方法的性能。一般是采取图表展示并配上文字解释。

(1)内部比较

不同参数下或者研究方法的变种的实验结果对比一般我们称之为内部对比。通常这种对比都是为了说明我们的研究方法各个影响因素都已尽量做到最优。以神经网络为例,涉及的参数是非常多的,因此进行对比时选择最重要的几个即可。研究方法实际上不是固定的,即使都属于一个大类,其中的细节也是有可能有差异的,因此针对好几种可选方案,应该选择表现最优的一种,这也说明我们考虑了各个维度。

(2)外部比较

外部比较主要是与已有的算法进行比较,包括最经典的算法、最先进的算法等等进行对比。需要注意的是不需要在所有数据集上都比其他算法更优,需要使用文字说明自己的研究方法在数据集上的什么方面是更占优势的,但是一个方法不可能只有优点,没有缺点,因此需要不能仅说明优势,也得说明缺陷是什么。

实验结果总的来说反应的是研究方法的性能,主要采取图表配以文字。这需要我们具备一定的观察能力,可以从图表中看出我们研究方法的优缺点是什么并能准确表达出来。

结论

结论不宜过长,五句即可。若有需要讨论的内容,可以单独使用一节进行讨论。摘要中也涉及到实验结果之类的句子,我们需要避免使用摘要中的句子。结论与摘要需要区分开,结论相较于摘要可以写的更加具体,具体到论文中的某个算法、某条性质、某个定理、某个实验结果,这样就与摘要产生了区别。结论中也可以说明进一步工作,这也可以给读者一定启发,读者可以沿着进一步工作继续发展这一领域,这也是本篇论文的一个重要贡献。

参考文献

参考文献以本科写论文的经验来看是非常容易出现错误的,并且这种错误本人很有可能是很难发现的。为了格式规范,我们应该使用latex提供的bib文件进行参考文献管理。每篇参考文献只需要写7-8行,其中包括作者、标题、期刊、年份、卷、起始页码、doi码等信息。我们只需要将信息填写进对应位置,不要自己书写或者百度粘贴,为自己带来额外的工作量。最后为了保证格式的正确性,需要检查生成的pdf文件。

图表

图相较于文字更加直观。图的运用是有利于读者阅读的。绘制图片的时候有以下注意事项:

(1)需要绘制矢量图,矢量图的放大或者缩小不会失真;

(2)围绕图的说明性文字应该不低于图片本身版本的1\2,当然也可以更多。有时候为了排版会增加文字性说明以保证版面的美观;

(3)图的注释可以较长。说明图中各个部分的含义,以供读者阅读;

(4)图片虽然彩色更加美观,但会更加昂贵。有些期刊可以选择纸质版是黑白的,电子版是彩色的。因此在绘制图片的时候需要保证打印时也能完整表达作者意图;

(5)在文中做引用时需要注意与图片编号一致;

(6)论文中图的数量需要保持在所投期刊已发表论文中图数量的平均值左右,这样写出来的论文会比较符合所投期刊的风格,更不容易被拒稿。

表格在latex中由代码命令控制,一般表格的宽度设置为与文字边距相同,采取三线表的形式。在表中也应该明显体现最好的效果,如使用粗体、斜体等对其他的数据进行区分;对于表中大于1000的数据使用逗号隔开,如1,001;若使用表来表示数据集,应该采取统一的某种排序方式进行排列,以保持所有表格中的顺序一致。同样地,表的数量也应该进行有意识的控制。

图和表在一定意义上可以转换,所以为了保持图表的数量可以进行一些转换,若表的数量太少则将图转换成表,反之亦然。

审稿意见的回复

若审稿人没有直接拒掉稿件并且给出了修改意见,那么当我们修改过后,很有可能会通过。这时候需要对审稿意见回复。需要注意的是:

(1)针对审稿人和编辑给出的修改意见,需要做到态度端正;

(2)回答问题不要顾左右而沿它,直接回答问题即可;

(3)回答问题不用过长,在论文中做出修改比回复审稿意见更加重要;

(4)对论文做出的修改应该使用蓝色标注;

(5)审稿人的修改意见中若存在错误,需要自行修改过来,而不是全部照抄修改意见。

总结

之前我认为写论文就是将自己的研究工作表达出来,但是学习了闵帆老师的论文写作课程才发觉原来这是一门大学问。从中学习到了许多之前从来没有关注过的知识,比如不能使用缩写、尽量避免使用某些词汇等小的知识点,也学习到了诸如摘要该怎么写、论文主体应该包含些什么、结论应该采取什么固定格式等等大的框架,从小到大,系统地学习了该如何写好一篇论文,对我今后写论文有很大的帮助。本帖仅对闵老师的论文写作课程做简要总结,今后需要时常翻阅,以对如何写出好的论文进行更加深刻的体会。非常感谢闵老师不吝赐教。

评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值