论文写作课程总结,主要参考闵帆老师博客
学术论文基本概念
学术论文是对研究工作的阶段性总结,创新点只需要一两个就足够发表,不需要华丽的文采,但要将正确的内容放在正确的位置,需要有清晰的结构:引言、文献综述、研究方法、实验结果、讨论和结论等部分。
论文并不是想怎么写就怎么写的,需要按照模板写。模板是通过阅读文献(建议读顶刊(打磨得更好),顶会),自己总结而来的;也可以使用别人总结的模板(自己实验室相关方向)。
论文结构
题目
要有吸引力(新问题、新方法),但是要便于理解(应使用领域内常用词汇)、易于检索。
长度控制在40-60个字母之间(越短越创新,越长范围越窄)。
尽量不使用based on(烂大街)。
使用through、with等来表示技术。
题目可以写上算法的缩写。
摘要
只写十句话,以下是八股结构:
- 问题及其重要性:说明问题所属的领域,解释最重要的概念,或者强调问题的重要性。
- 已有工作:描述该问题的流行解决方案。
- 已有工作局限性:以However开头,但不要批得太狠。本句挖坑,但不要挖太大确保能填上。
- 本文工作:以In this paper开始,出现算法的缩写。
- 之后用三句话介绍本文工作的3 个技术/步骤/方面/优势/贡献。
- 实验设置:给出数据来源等。
- 实验结果:提高了效率、准确率等(有时候会要求写详细点)。
- 提升:吹自己的论文有何意义。
关键词
关键词是摘要的补充,一般需要3-5个关键词,每个关键词1-3个单词,关键词按照字母顺序排列。
引言
讲述完整故事。
引言很重要,很多审稿人在读完引言后, 就有了基本 (80% 以上)的判断。
引言可以看作摘要的扩展(因此,摘要更要写好),即将摘要的每句话扩展成一段话。其中,每段应该有5-10句,同时不要让段落太长或太短。
流行在引言中放一张图,该图可以展现核心技术、算法框架、小的运行实例、效果对比等等。采用这种风格,应该围绕图来介绍,帮助读者更快理解论文主要内容。注意:图画好了, 可以加分; 画不好的话, 还不如不要。
文献综述
每篇所引用的论文都应该有文献综述。
在引言中引用得比较简略,在相关工作中详细引用。
文献应该分类,而不是全句引用。
参考文献的引用不能作为句子的主语和宾语。
合理评价相关工作的优缺点:优点使劲夸,说缺点要中肯。
理论部分
理论要完备,符号风格要一致。
重要结论叫定理(theorem),方便定理理解的叫引理(lemma),对定理进一步推导的叫推论(corollary)。
算法伪代码
需要说明输入、输出
需要对主要步骤进行注释
长度控制在15-30行
可引用数学式子
同时一般还需要对算法进行时间、空间复杂度分析
实验
实验占据一篇论文的大半篇幅。
需要介绍实验设置相关信息,如:所用数据集(来源、大小等重要信息)、实验相关参数设置(方便复现)以及所用设备信息。
实验部分主要是为了回答作者和读者关心的问题,所以可以采取一种比较八股的方法:**自问自答。**即,在实验这部分开始,可以提出问题,当展示完实验结果后,一一回答这些问题。
实验是为了通过对比来展示自己算法的优越性,因此,要挑选表现好的结果进行展示(注意:而不是修改实验数据)。
常见的对比方法,可以分为内部:通过参数的变化来说明性能的变化;可以分为外部:通过本算法与经典方法、基准方法和最先进的方法进行比较。
注意:
- 对于实验结果应该有详细的分析;
- 并不需要在所有数据上都最优;
- 除了分析自己算法的优势,还应分析它的劣势。
结论
不需要太长,一般5句话。当想写的内容较多时,可以在结论这部分之前单独加一节Discussions。
虽然结论一般和摘要讲的内容差不多,但是要避免与摘要的句子重复。结论相比于摘要更具体,当摘要中写做了某事,结论中可以写通过这些事,得到了什么效果。
建议可以额外讨论进一步工作,因为可以按照这个思路进行进一步研究。(这样有可能就提高了引用量)
参考文献
注意!!!不要直接使用网上的 bibitem。
写参考文献实际上是进行填表,即:使用以下模板,将引用的论文的信息填写进去:
@ARTICLE{MinZhang2020Frequent,
author = {Fan Min and Zhi-Heng Zhang and Wen-Jie Zhai and Rong-Ping Shen},
title = {Frequent pattern discovery with tri-partition alphabets},
journal = {Information Sciences},
year = {2020},
volume = {507},
number = {1},
pages = {715--732},
doi = {10.1016/j.ins.2018.04.013}
}
@INPROCEEDINGS{MinCai2007Dynamic,
author = {Fan Min and Hong-Bin Cai and Qi-He Liu and Zhong-Jian Bai},
title = {Dynamic discretization: a combination approach},
booktitle = {Proc. ICMLC},
year = {2007},
pages = {3672--3677}
}
注意事项
论文写作工具
只建议使用Latex
,虽然需要写代码,但是容易上手。重要的是格式调整非常方便。本科写毕业论文,经常调整一个地方的格式,导致所有格式都乱了。
而且,每个期刊都会提供格式文件,格式修改非常方便。而且,网上有许多模板文件,通常只需要将对应位置替换为自己论文内容,稍作修改,就能得到一篇新的文章。
Latex格式
不用重头写,最好是找已经被该期刊录用的论文的源文件,或者是找该期刊提供的模板文件。
cls
文件:用于控制论文的总体格式
bst
文件:用于控制参考文献的格式
尽量避免使用\usepackage
导入包,以免不兼容,导致期刊投稿网站上无法运行。
慎用的单词与词语
一般而言,未在任何学术论文中出现的单词,严禁使用。
可以使用linggle网站,来查询单词和词汇的使用频率,一般选择使用频率高的的词。作为初学者,尤其要注意是否滥用某词,所以需要全篇自查。
论文属于正式文章,所以通常不使用缩写,即应使用have not, do not, cannot等。仅当使用authors’之类的情况,才使用撇号。
禁止在句子开头使用And(相邻句子本身就具有相关性,使用And毫无意义),句中慎用and(因为从语义上可能无法并列);
禁用Easy(简单的东西就没研究价值);
慎用Simple(与easy类似。可以使用simple yet effective);
慎用Solve(彻底解决某个难题, 写出了相应的定理与证明,才能使用solve。一般使用handle或address);
慎用Novel(视工作创新性而定,一般的话使用new,投顶刊顶会使用novel);
Only靠后使用(consider only uniform distribution 而不是 only consider uniform distribution,表达自己有某个能力,而没有做);
慎用Prove(实验结果通常只能show,仅当写了定理、性质及其证明过程, 才能说 prove)。
解决英文句子语法问题
好的中文 = 好的英文。
句子的背后都是正确的逻辑。
可以使用charGPT来润色句子(注意专业术语),但不要用来生成句子。
两种方法写出好的句子:
借鉴法(推荐使用)
基本步骤:
- 寻找相关方向的顶刊论文(打磨得更好)。
- 找出各部分的简单句子。
- 得到句型
注意事项:
-
按照一定的方式(句子基本结构,出现的介词,出现的位置等)来分别总结(方便查找和使用)。
-
不要使用从句(复杂句式),不便于理解。
优缺点:
- 优点:写的句子基本没有语法错误,使用总结的句式也很快。
- 缺点:需要积累很多句式,建议第一篇论文先花一周总结两百多个句式。
倒腾法
基本步骤:
- 写一个英文句子。
- 使用翻译网站(百度、谷歌)翻译成中文。
- 再翻译成英文,直到中英文句子都不再改变。
- 再将剧中的非专业词汇替换为正确的专业词汇。
注意事项:
- 最好从英文句子开始。
- 如果最终的句子和最初写的句子相差太大,且没有正确表达想要表达的意思,需要根据最初的句子对最终的句子进行修改。
优缺点:
- 优点:可以按照自己的意思来写。
- 缺点:中文表达可能很差,导致最终句子还是不合格,很花时间。
符号系统
不要对论文中的公式、符号进行额外的、特殊的处理。
严禁在word中使用公式编辑器编写公式,再转到Latex中。
注意一篇论文符号系统的一致性,不要出现一个符号代表两种意思的情况。
不同字体的同一个字母表示不同的涵义。
一个公式有编号就能使用(通过交叉引用)。
数学表达式太长,应将它进行切分。
文字中的数值均使用 $$ 括起来,与纯文字有点差别。
使用千分位 (1/4 空格 \,
) 的作用: $123\,456.789\,01$
的效果如下:
123
456.789
01
123\,456.789\,01
123456.78901
数值与单位之间也使用千分位分开, 且单位用正体. 如: $35$\,m, $20$\,kg
可以通过已发表论文中的tex
文件来学习数学表达式。
图
使用矢量图,可以使用Visio和Inkscape绘制。
要注意美观,可以使用公众号或知乎上的配色方案。