目录
引言
学习完闵老师的《论文写作》课程收货满满,我明白了完成一篇高质量的论文的要求与需要注意的问题,本文将在课上的学习内容作为分享,以便自己与大家学习利用。
论文写作 1: 学术论文的基本概念
学术论文是科研八股文,每个部分的内容撰写有固有的一些要求,论文不需要有多么高级的文采,只是需要把正确的内容放到正确的位置。
如何撰写学术论文其实有着很多的学问,很多实战细节需要自己细细考量。其中选题的新颖性一定很重要,与论文审稿是否通过直接挂钩。论文的创新点也不宜写的过多,一般来讲一篇论文一到两个创新点。
选题涉及到的领域应该是自己熟悉的,课题相关数据需是切实可行,可获取到的。选题必须是基于当下和现实的。论文选题的范围不宜过大,把自己课题的亮点突出即可。范围过大不容易让读者抓住文章要点,同时不便于作者突出主体;范围过小不容易作者对课题的深入研究。
确定想投的期刊后,最好找该期刊已经录用的论文源文件,其次找该期刊提供的模版文件,从一开始就注意写作规范的问题可以有效地避免日后因格式问题打回修改的麻烦。
论文写作 2:Latex格式文件
Latex可以方便地实现文本和样式分离,而且Latex样式的上限非常非常高。这类的样式一般是研究室通用的,很多时候根本不需要改动。这时候专注内容就可以了。Word也能做,但Word做起来往往会牵扯到很多的改动,就像Excel可以解决大多数你用grep/awk/sed来解决的事情,但实际操作起来成本很高。
每种期刊都会提供一个或多个格式文件. Latex 源文件只需要进行少量改变, 就可以获得完全不同的版面。这里我们没有必要系统的学习Latex语法以后再进行上手操作,我们只需要找到适合的模版进行小小修改就可以了。
- 所有列都为左对齐, 使用 0.0000 而不是 0 来保证对齐
- ± \pm± 用于显示标准差. 使用下标以节约版面
- 粗体指示最好的效果, 斜体指示次好的效果
- Meanrank 指示不同数据集的总体效果
- 数据集应按照某种方式排序, 如对象数、属性数、来源领域等, 并保持所有表格中的顺序一致
- 大于 1000 的数据应该用逗号隔开, 如 1,024
- 作为良好的习惯, 源码里面也应该对齐, 而不要因为不影响最终 pdf 效果而偷懒
论文写作 3: 慎用的单词与短语
一般而言,未出现在任何学术论文中的单词,不可以使用。
类似Have’t 与 Don’t这类平常可以不用间写的禁止间写,当 authors’这类必须间写的才允许间写。
句子开头禁用And:句子与句子之间存在关联,不需要And。
居中慎用and:居中使用and必须保持and前后对仗工整。
禁用Easy:太狂。
慎用Simple、Solve:simple yet effective可以用,单用最好不用,Solve表示彻底解决,一般指数学难题、定理这些,我做机器学习,用handle 或 address替代。
Novel与New:小改变用new,大改变用Novel。投撇的用new,投核心用Novel。
Only往后放:放后面:做了……但仅仅……。放前面:仅仅做了……。
禁用Prove:想了下,做机器学习应该不会证明什么定理之类的,用show足够。
使用https://www.linggle.com查看词频,选高频词汇。
论文写作 4:英语语法问题
倒腾法不建议使用,浪费时间,对长期写作没有帮助且令人糟心。
建议使用借鉴法,找顶刊中各个部分的简单句子,获得这些句型后自己使用。
论文写作 5:符号系统与表达式问题
符号表达式应该整洁规范,使人一目了然。一篇论文应该有一套自己的数学符号系统,当读者阅读出现问题是可以去查找该系统中符号代表的含义。并且我们也应该寻找一篇规范论文的.tax文件,去学习这篇论文中数学公式的数学格式。
下图参考闵老师的blog:
论文写作 6:论文题目
认字认一半,论文也先看标题。论文的题目必须要有吸引力,抓住审稿人的眼球,且题目要易于理解,易于检索。长度最好控制在40至60个字母之间。尽量不要使用based on等词汇,多使用through,with等来表示技术。
如果主要贡献为算法,题目的缩写就应该为算法的名称。
好的题目不仅能让审稿人眼前一亮,就跟两个人谈恋爱一样,在没有发现对方内在是什么样的时候,美好的外在能够增加吸引力,从而想要更深入地了解其内在品格。
好的题目也可以增加论文的引用率。
论文写作 7:摘要
摘要又称概要、内容提要,意思是摘录要点或摘录下来的要点。摘要是以提供文献内容梗概为目的,不加评论和补充解释,简明、确切地记述文献重要内容的短文。
摘要首先介绍目前所涉及问题的研究工作情况,包括所涉及的问题领域和一些概念解释。还有所涉及领域的最新成果,并且提出现有成果的局限性和缺点。毕竟,我们一直在说我们是站在巨人的肩膀上开展研究的。
接着需要说明自己对于该问题的所做的工作内容,包括自己在实验中所用的思路方法和技术以及数据。
最后展示自己在实验中所取得的结果,具体可以体现在例如实验精度的提高或者运行时间减少等技术的提高。
论文写作 8:摘要十句
- 论文的主要、重要内容,一般包括三部分:已有工作的评述,本文工作的描述, 实验结果
- 问题及其重要性
- 已有工作
- 已有工作局限性
- 本文工作
- 本文方法的第 1 个技术/步骤/方面/优势/贡献
- 本文方法的第 2 个技术/步骤/方面/优势/贡献
- 本文方法的第 3 个技术/步骤/方面/优势/贡献
- 实验设置
- 实验结果
- 提升
按照以上后十个的方法来写论文摘要,能够保证字数和质量都能满足条件。格式化的摘要模板能够保证论文摘要能符合要求,让审稿人感觉投的论文次数已经很多了,非常老练,可以增加印象分,提高论文被录用的概率。
论文写作 9:关键词
即论文的关键信息,不仅体现论文主要内容,更重要是,让你的论文更容易被搜索到,从而提高文章被引用的次数。 关键词常被看作摘要的一种补充,一般需要 3–5 个关键词,关键词一般由 1–3 个单词构成,将关键词按照字母表排序。从一部分读者的角度来说,他们更偏向于关键词检索,于是我们可以理解为关键词其实也是可以作为检索过程中的重要一环,所以写好关键词很重要,无论中文写作还是英文写作。在关键词的排序上,老师的建议是按照字母排序。在内容上,关键词是从论文题目和摘要以及正文中提取出来的,要起到对论文的中心内容有实质的表述作用。
论文写作 10: 引言
引言应该对整个故事进行详细的描述,最八股的方式,就是采用与摘要相同的节奏。每段应有 5–10 句。这样,该段就有 50-150 个单词。计算机领域 (特别是顶会) 流行在引言里面放 “开局一张图”。
有些期刊和会议还喜欢让作者把自己的贡献单独列出来, 放在实验陈述段落之后。期刊论文要求写论文的组织结构。单词没有拼写、语法错误。句子表达简洁、得体、有力量。段落丰富。
文章结构条理清晰,要写明创新点。
论文写作 11: 文献综述
每篇论文都应有文献综述,可以在不同的地方描述。文献需要进行分门别类的介绍,参考文献的引用一般仅仅是一种附属品,不应将参考文献的引用作为句子的主语、宾语等。以年份为主线的综述也不值得提倡,不要一次性引用太多文献,不提倡全句引用,合理评述相关工作的优缺点。要充分肯定前人的工作,表示出足够的尊重。
从功利的角度看,尊重他人的工作不一定会提高印象分,但是不尊重一定会减分;从非功利的角度来看,世界上没有绝对的创新,现在的任何发明都是参考了前人的工作,更别说一篇论文了。学者们都是站在巨人的肩膀上的。
论文写作 12: 理论部分全靠数学功底
理论部分要有清晰地数理逻辑,否则整个论文体系就会垮掉。理论应该完备,符号要保持同一风格。重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary,,附属于算法的叫 property。
论文写作 13: 算法伪代码
伪代码要需要说明输入、输出,方法 (函数) 名可写可不写,如果被别的方法调用就必须写,需要写出主要步骤的注释。
伪代码长度长度控制在 15-30 行,可使用数学式子或对已有数学式子的引用,不重要的步骤可以省略。
一般需要进行时间、空间复杂度分析,并写出配套的 property 以及相应的表格,以使其更标准。
论文写作 14: 实验部分
实验部分是一篇论文的重头戏,尤其对于计算机专业的我们来说。因为创新的过程与结果证明均来自于实验部分,所以要重点展示此部分。
数据集信息:数据集越多,覆盖领域越广,结果就越可信。数据集大些更好。获取自己主要参考文献中的数据,有利于进行比较。要么获得对比算法的源码,要么实现它们。
同一结果不应该在图和表中同时出现,这样就重复了。
自问自答模式:实验的主要目的是回答一些作者和读者关心的问题,采用自问自答的方式,在实验之前提出这些问题,在实验结果列出之后逐个回答它们。
内部比较:展示参数变化所导致的性能变化。展示主要方案与其变种相比的优势。
外部比较:需要比较经典方案,基准方案,最先进的方案。很多时候使用柱状图。如果数据太多, 用表格就比图合适。
如果要把参数影响,数据集大小影响也表现出来,就只有用折线图。
最重要的比较放在最后。
要有足够的文字进行分析,不能让读者自己去观察。
并不需要在所有数据集上击败其它方案。
在分析自己方案优势之余,也应该分析它的劣势。
论文写作 15: 总结与展望
结论不要太长,五句就够了,要注意避免使用与摘要内相同的句子。如果有需要讨论进一步的工作,可以再列出三至五条,这样也可以留给其他研究人员更多发论文的机会,这样自己这篇论文的引用率也会大大提高。 详细的东西已经在论文结尾前介绍完毕,剩下的结尾不应该继续啰嗦,快刀斩乱麻,要干净利落不拖沓。
论文写作 16: 参考文献
参考文献在格式上容易出现很多错误,可以使用Latex专门的文献管理工具,找到一个正确的模版,根据自己的文献进行修改,套用模版即可。列举一些tips:
- 千万不要直接使用网上的 bibitem
- 将等号进行列对齐
- 名字要有意义
- 名在后,姓在前
- 作者名不要缩写
- 注意题目的大小写,可以用花括号强制设置
- 期刊的名字按照正常方式写即可
- 会议名如果使用简称,就不要再写全称
- 由于有 year 域,不要在会议后面再加年份
- 页码之间应使用两个连词符 -,最终的效果就是一条比较长的横线
- 特殊字符需要使用转义符才能正常显示
- 除最后一行外,其它行应以逗号结束
- 有些作者喜欢在名中间连词符
- 为了保证格式的正确性,应检查生成的 pdf 文件
论文写作 17: 图片与图摘要
我们论文中使用矢量图,这样可以避免放大时失真;图片需要画的言简意赅,可以寻找相关和不相关专业的同学进行指导。不要使用 Excel 画图, 不美观。图注可以相当长,没有问题。一般而言,引用图片时,应保持与图片编号的一致。彩图很贵,要计算成本。有些期刊要求提供 Graphical abstract,即使用一张图 (含图注) 把论文的主要思想介绍清楚。
论文写作 18: 审稿意见
回答要跟问题标号对应,如果问题没标号可以自己标一个。回复要做到“点对点”,问什么答什么。打回来修改说明审稿人觉得有机会,要怀有感恩的心。
审稿人提的小建议不要回复冗杂的客套话,小建议直接说“Suggestion accepted”就行,简单干脆也不浪费审稿人时间。
千万不要把自己找到的但审稿人没发现的小问题写进回复里,审稿人会觉得我之前交为什么不自己检查一下,要给审稿人一种我已经检查了很多遍,凭自己已经发现不了问题所在的感觉。
总之,在思想上务必要端正态度,编辑和审稿人花大量时间义务审稿不是想为难你,而是来帮助你改进论文质量。问题应该直接回答,而不要顾左右而言他。回复不要太长,正文中进行相应的修改才是重点。正文中修改部分应用蓝色字标出。
论文写作 19: 拒稿原因
可能的原因:
文字不规范:单复数不对、时态不对、口语化、缺主语、缺谓语动词和句子太长难于阅读等问题。
试验不够:数据集太少、数据集太小、对比的算法太少、对比的算法太老和效果不明显等。
另外还有内容不一致、理论不强和创新不够等问题。
论文写作 20: 不可原谅的错误
容易出现的低级错误:
- 大小写。
- 标点符号后面缺少空格。
- 标点符号前面多了空格。
- 小括号前少了空格。
- 参考文献引用的方括号前少了空格。
- 连续几篇文献的引用之间多了空格。
- 左单引号是在键盘左上方,Esc 键下面,即 `。两个左单引号就变成一个左双引号。右双引号一般使用两个右单引号生成,在某些系统上 ,也可以用双引号本身获得,但不具有通用性。
需要特别注意的低级问题:
- 符号应规范,且保持同一篇论文中的一致性。
- 严格禁止使用 Word 的公式编辑器写式子,然后转到 Latex 源文件。那种方式有太多的额外控制,导致不规范。
- 如果一个数学表达式是一个句子的结束,应在末尾打个句点。
- 如果一个数学表达式还没把话说完,应根据后面的情况选择相应的符号。
- 如果式子里有分情况讨论,应正确使用逗号,分号。
- 注意是否存在重复的标签与缺失的标签。
- 不使用过长的句子。学术论文的主要功能是进行读者与作者之间的交流,句子太长影响阅读。
- 检查是否存在类似缺少主语的不完整句子。
- 检查基本语法、单复数、三单形式。
- 同一词组在同一句子中避免重复出现。
- 强调文字使用 \emph,如果使用 $ 符号括起来就错了,后者有更大的间距,很容易看出。
- 注意表格宽度。
- 数学表达式宽度不应超出文字宽度。这里既包括编号的数学表达式的,也包括在文字中间未编号的表达式。
- 图片要用矢量图。
- 流程图要按照标准画。
论文写作 21: 会议论文较于期刊论文区别
论文被会议录用后,可以适当增加一定 (如1/3) 的新材料,可以再投到期刊。会议论文没有章节组织描述且相关工作描述比较少,实验比较少, 不讨论 future work,参考文献较少。
会议投中后转期刊需要给期刊进行说明,避免学术不端的风险。可以先提前写好期刊论文,再根据会议论文的要求进行修改。
总结
如全文所见,于《论文写作》课程中学到了相当多的实用知识,在此诚挚地感谢闵帆老师倾囊相授。同时文中若存在错误,也请各位师友批评指正,感谢!