前言
这篇博客是学习了闵老师的《论文写作》这门课程后的一个总结,这门课程对论文写作过程中需要注意的点都有很详细的说明,一些需要避开的坑也都列出,课程内容通俗易懂,满满干货,让我轻松学习的同时也收获了许多,非常感谢闵教授的教学,本贴内容有不恰当的地方欢迎指出,想要深入学习的朋友请移步闵教授博客。
本帖先从论文写作框架讲起,之后再对剩下的重要内容进行补充。
1.题目(Title)
题目对于论文来说十分重要,如果论文是孩子,那么取一个中肯而闪亮的题目是非常重要的。
1.题目必须要有吸引力
表明论文提出的新问题或新方法。
能抓住人眼球的题目,才能吸引审稿人的注意。
2.题目必须易于理解和检索
词汇或者术语在这个邻域内常用。
检索次数越多,引用次数才可能越多。
3.长度最好控制在40-60个字母之间
越长限定越多, 适用范围越窄, 创新性越低,。
越短表示创新性越高,越短的题目被录用,就越牛。
4.避免使用 “based on”
有些中文期刊明确要求论文题目不要使用 “基于”, 因为这种题目泛滥。
5.在表达使用某个技术时用 “through”、“with”
2.摘要以及关键词(Abstract & Keywords)
摘要就是要把文章重要的内容摘录出来,是文章主要内容的总结和提炼。它通常包括三个部分:已有工作的评述,本文工作的描述,实验结果。有固定的模板,闵老师的总结大概就是10句。
1.问题及其重要性
此句说明问题的领域,可以解释主要的概念或者说明问题的重要性。重要性描述的时候,要有意义和针对性。
2.已有工作
本句可以描述该问题的流行解决方案。如果说我们做研究是“站在巨人的肩膀上”,本句就描述巨人长什么样子。
3.已有工作局限性
本句以 However 开头,需要注意:指责不要太强烈,要尊重别人的劳动;实在不行也可以不写本句, 但这样显得没有底气。
4.论文的主要内容
如果可以,最好是对标题的扩展。此句可以超过20个单词。
5.算法的第一个、第二个、第三个方面/技术
6.实验设置
此句要说明实验中数据集的域、来源等。
7.实验结果
提高了准确性,效率等等。
8.吹牛
自己的实验有多么厉害,做了多少贡献。
9.关键字
关键词最好3~5个;除了相关的术语,关键词不能过长。
关键词应有序;关键词的摆放可以按字母的升序排列。
3.引言(Introduction)
引言是为论文做铺垫,在计算机论文中,引言需要讲述完整的故事。很多审稿人在读完引言后,就有了基本 (80% 以上) 的判断。如果引言写得漂亮,他就会在后面的正文中找出一些证据,赞扬研究工作有意义,理论完备,实验效果好等等。如果引言写得难看,感觉作者没受过专业的科研训练, 他也会在正文中找出几条问题,说论文写得不好。因此, 要把重要的东西放在引言里面讲清楚了,不然一个读者看完这篇论文后,很可能丢失引用的机会。
1.采用与摘要相同的结构
摘要的每一句,都扩展成引言中的一段。每段的首句被称为"主题句",你也可以把摘要相应那个句子稍作修改移过来。主题句通常 是一种"断言",该段其它句子的作用,都是支撑该断言。
2.每段5~10句
根据前面的规定,每段可能是50-150个单词,若相邻两段比较短,则合并。
3.算法图或运行示例
在引言的部分放算法图,通过该图读者能够更快掌握全文主要思想。可以理解为是 “开局一张图”,由此可见,这张图需要画得很漂 亮!
4.引言层次
没有拼写及语法错误(单词级)
表达简洁(简单句够用了)(句子级)
what、why、how三个角度分析(段落级)
条理清晰(章节级)
4.文献综述(Literature review)
文献综述就是对前人研究的阶段性总结,不可进行简单的罗列,表示对前人的尊重。
1.文中不同的位置描述
引言中: 一般描述得比较简略。
第 2 节专门的 Related work:描述得比较详细。
实验之后:不想破坏自己论文的完整性, 特别是有 Preliminaries 一节时, 可考虑放到这里。
在引言中的描述与第 2 节中的描述不要简单的重复。
换言之, Introduction 和 Related work 应该统一布局,而不能相互打架。
2.分类别介绍
分成几个大类,大类再分成几个小类。这样的综述才有目的、有营养。
3.引用注意
参考文献的引用一般仅仅是一种附属品,通常先保证自己的句子语法没有错误,再把引用加上去。不要把引用当做句子主语或宾语 等,不要一次性引用太多文献,否则会被认为没有给予作者足够的尊重。不要照抄照搬,也就是所谓的全句引用,如果非要全句引 用,要在引用的句子上加上引号,否则被认为学术不端,一生名誉毁于一旦,自己掂量一下吧。
4.合理评述相关工作的优缺点
优点是你选择跟随性工作的原因。
缺点是你论文工作的动机。
在谈到优点时可以使劲夸,但也不要用口语;说到缺点时要中肯,也要客气,很可能文献作者也是你这篇论文的审稿人。
5.理论(Theory)
理论部分全靠数学功底,理论应该完备,符号要保持同一风格,重要结论称为定理 theorem,定理前面打辅助的叫作引理 lemma,定理后面的尾巴叫推论 corollary, 附属于算法的叫 property。
6.算法伪代码(Algorithm Pseudocode)
伪代码是论文的核心之一,要充分体现整体代码的思想,一般要把整体代码一步一步精简。
需要说明输入、输出、方法名,写出主要步骤的注释。
长度控制在 15-30 行。
使用数学式子或对已有数学式子的引用。
时间复杂度和空间复杂度分析,并写出配套的 property 以及相应的表格,以使其更标准。
实例:
7.实验(Experiment)
实验是整篇文章最重要的部分,有的实验占了整篇文章的一半篇幅。
1.数据集越多越大可信度越高
数据集越多,覆盖领域越广, 结果就越可信,12 至 20 个公开数据集就足够。使用参考文献中的数据集更好,方便比较。如果实现 别人的代码和他的结构不一致,则使用自己实现的版本作比较。
2.实验内部比较
展示参数变化所导致的性能变化,二维图一次只能展示一个参数和一个性能指标。因此,如果有很多参数,就只能讨论最重要的几 个,否则图太多。
展示主要方案与其变种相比的优势。有时候我们有好几种可选方案,通过比较,可以获得最佳那个。
3.实验外部比较
外部比较是与已有算法进行比较。
需要与经典方案,基准方案,最先进的方案进行比较。
很多时候使用柱状图,如果数据太多,用表格就比图合适。如果要把参数影响,数据集大小影响也表现出来,就只有用折线图。
最重要的比较放在最后。要有足够的文字进行分析,不能让读者自己去观察。
并不需要在所有数据集上击败其它方案。在分析自己方案优势之余, 也应该分析方案的劣势。
8.结论(Conclusion)
结论不要太繁琐,作为文章的最后一部分,通常审稿人和读者都会逐句阅读。
1.长度
不要太长, 5 句就可以。
如果想讨论的内容比较多,在本节之前加入一个单独的 Discussions 小节。
2.内容
避免使用与摘要内容相同的句子。
摘要里面说我们做了哪些事情,而这里应该说我们获得哪些观察与结论。也就是说,结论比摘要更加具体。
如果要讨论说进一步工作,可以列出 3 至 5 条。如果这一部分写得好, 就会有很多的引用。引用数量也比论文发表数量更重要。
9.其他内容
9.1论文工具
俗话说,磨刀不误砍柴功,在电子信息迅速发展的时代,作为计算机专业的学生,更应该抓住信息,充分利用一些学习工具来提升学习效率,下面介绍了一些学习文献可以用到的app或网站。
1.阅读英语论文工具小绿鲸
在开始写自己的论文之前,有一个长时间的读论文阶段,在读的过程中,就得不断思考总结,诞生自己的idea,边读边写才能达到最好的效率,如果把文章全部读完了再写,那可能读了的文章还要重新读一遍了,写论文的整个周期就会被拉长。当然,在读英语文献的过程中,我们可以借助很多的软件来提升我们的效率。
小绿鲸英语文献翻译App
小绿鲸英语文献阅读器是一款专业的文献管理和阅读工具,支持多种途径的文献导入,本地导入文献后,阅读器能够智能识别文献 信息,如标题、作者、出版年等,自动建立文献库,用户可以随时查看和管理。
小绿鲸英语文献阅读器提供了多种阅读模式,如翻页、滚动、横向翻页等,用户可以根据自己的习惯进行选择。
小绿鲸英语文献阅读器还支持用户在文献中进行笔记和标注,并可以快速搜索和管理。
2.论文写作使用工具latex
英文论文一定要用latex来写,并且从头写,要使用期刊已录用论文的源文件或是该期刊提供的模板文件,因为每个期刊的模板不一样,最开始想好投那个期刊可以节省很多麻烦。并且使用Latex编写数学公式非常方便,不像word那样,插入公式后,行间距会变化, 而Latex不需要担心这个问题。在每次对论文进行修改之前,都要保存上一个版本,方便后续的查阅或者是改正。
latex排版
用于控制论文的总体格式。
用于控制参考文献的格式 。
尽量不要引入特殊的包, 以免在其它系统 (特别是期刊投稿网站上) 上运行不出来。
少使用 \usepackage 以保证兼容性 。
数学公式
如果论文中涉及很多数学符号,应该给出一个符号表。
不要对式子进行额外处理,包括增加空格等。
对于不同字体的同一字母也有不同含义,所以要检查符号系统的一致性。
数学式子是句子的一部分,如果太长就用latex里面的切分句式来自动分行,并且数学式子应该存在相应的逗号、分号、句号。
最好找一篇已经发表论文的.tex文件学习数学表达式。
表格的控制,所有列都为左对齐,使用 0.0000 而不是 0 来保证对齐。
± \pm± 用于显示标准差, 使用下标以节约版面。
粗体指示最好的效果,斜体指示次好的效果。
Meanrank 指示不同数据集的总体效果。
数据集应按照某种方式排序,如对象数、属性数、来源领域等, 并保持所有表格中的顺序一致.
大于 1000 的数据应该用逗号隔开,如 1,024。
作为良好的习惯,源码里面也应该对齐,而不要因为不影响最终 pdf 效果而偷懒。
3.论文查阅工具letpub
LetPub是ACCDON公司(美国)旗下为非英语国家科研学者提供最优质SCI论文编辑和各类相关服务的专业品牌。LetPub 旨在化解以非英语为母语的科研学者的研究论文因为文字表述的不足而令研究成果本身受到偏见,并在已有实验结果的基础上在论证结构和专业行文风格上增加论文的影响力,推动更多的论文在世界高水平的学术期刊上成功发表。
登录LetPub的网站进入最新SCI期刊查询及投稿分析系统,有两种期刊查询方式,一是精确查找,可以通过期刊名称、ISSN等进行精确查找,也可以按照学科门类、影响因子等条件进行筛选;二是可以根据您的研究方向进行模糊查找,可以看到同一学科领域的期刊按照综合评分进行排名。在阅读文献之前先查阅文献的信息,来判断文献是否具有阅读的价值,可以节省大量的时间,不用在不相关的文献上花费过多精力。
9.2单词 短语 句子
1.慎用的单词和短语
不经常用在学术论文的单词慎用。
Have’t 与 Don’t
不要缩写,要写全have not、do not、cannot。除非authors’ 之类的情况。
And
由于句子之间本身就有相关性,所以不要在句子开头用And。句子中间也慎用and,除非对仗工整的词组,比如:data mining and machine learning。
Easy、Simple
禁用。如果一个东西是简单的,大家还研究它们干什么?
Solve
solve通常彻底解决某个问题,我们常用handle 或 address。
Novel
还是根据创新性来使用,除非你的方法很有创新性,可以用novel,否则还是老老实实用new吧。
Only
把 only 放到一个尽可能靠后的位置。
consider only uniform distribution 表示仅考虑了均匀分布,其他的还没有做。
only consider uniform distribution 表示太怂了,不敢做。
Prove
prove通常用于证明某个定理或性质,实验结果常用show。
**注意:**可以使用https://www.linggle.com这个网站来查询词汇使用频率,哪个词汇使用的多,就用哪个。下面的图中,显然 “related work” 更加常用。
2.解决英语句子的语法问题
一个非常棒的英文句式网站 www.phrasebank.manchester.ac.uk。好的中文=好的英语,它们背后都是正确的逻辑。要写出一个好的句子,有两种方法。
1. 借鉴法
基本步骤:找 20 篇顶刊的论文。一般不用顶会的论文,有的作者急于投稿,没来得及打磨。
找出各个部分的简单句子,如:The main idea is to estimate the total energy consumption by summing the energy contributions of each instruction。
获得句型,如:The main idea is to … by …在自己的论文中使用。
注意事项:应按句子出现的位置 (摘要、实验) 来分别总结,它们有不同的时态和味道。
复杂的句式 (带多个从句) 不要学,最好一个从句都没有,主谓宾最开心。
缺点:启动慢,需要积累很多的句式。建议写第一篇论文的时候先花一周弄 200 个句式,以后根据情况再增加)
优点:写的句子不会有基本的语法问题,越写越顺手,查阅句式的速度也会变快。正所谓:磨刀不误砍柴工。
两种模式:
正向构建 (基础模式)
找一篇论文,从中看到合适的句子,统统摘抄下来,并且按照一定的方式进行组织。例如:句子基本结构,出现的介词,出现的位 置。这个相当于机器学习的模型构建(决策树之类),需要训练,但使用时比较快。
反向查找 (常用变种)
对于自己要写的句子,从众多文献中查找一个与之最相近的句子。这个相当于 kNN 之类 的惰性学习。不需要训练,但使用时很费 时。
2. 倒腾法
基本步骤: 写一个表达自己意思的英文句子.使用 https://translate.google.cn/ 翻译成中文 句子。
再翻译成英文句子。直到中文句子和英文句子都不再改变 (即收敛)。
将句子中的非专业词汇换成正确的专业词汇, 这是因为翻译软件对它们不了解。
注意事项:最好从英语句子开始,而不是中文句子,否则更难收敛。
如果收敛后的句子与开始的句子相差太大,而且并不能表达你的意思,就需要根据前者来修改后者。
优点:完全按照自己的本意来写。 可以检查出一些单复数、第三人称、介词方面的问题。
缺点:你的本意可能就是混乱的, 中文表达也很差 (这是常态而不是个例),因此最后的句子还是不合格。单个句子的倒腾很花时 间,5 分钟至 30 分钟不等。
9.3图片与图摘要
一副好图胜过千言万语。
1.尽可能使用矢量图。
visio,matlab,python 生成的图都可以存为矢量图。建议不要使用 Excel 画图。
2.图注可以相当长
有些期刊要求图片是自封闭 Self-enclosed 的,即仅看图注的解释就够了。
围绕图的说明性文字应该比较长。 占的版面应不低于图片本身版本的 1/2, 也可以是两倍。
3.彩图很贵
如 ESWA 要求为每个彩图付费 $200. 有些期刊, 如 KBS 就比较 nice, 可以选择打印版为黑白,电子版为彩色。 因此,应保证你的图 片打印成黑白的也可以表达自己的意思。
一般而言,引用图片时,应保持与图片编号的一致. 如: 图注的编号是 Fig. 1,正文中就用Fig. 1 指代; 图注的编号是 Figure 1,正文 中就用 Figure 1 指代。但作为主语时, 建议使用 Figure 1. 这个也需要看下期刊以前论文的风格。
9.4实验效果不好怎么应对
实验效果不好,是方案设计的问题。针对不同的课题,解决方案是不同的,我们主要考虑以下几个解决方案。
1.设计替换方案
把算法的几个部件分别用类似的方案替换。
2.观察算法所适用数据的特点
一个算法的适用范围有局限性,这并不一定是坏事。可以把适用和不适用的数据集分开,结果放在两个表里面, 进行详细讨论。
3.使用各种评价指标
有可能某些算法在某些指标上表现更好,有一些常用的指标,或者更先进的指标。
4.调参
比如神经网络的层数,每层的节点数据,dropout 比例,很多人就是网络调参师。当然,做更加原创的工作,比天天调参有前途得 多。
5.输出中间结果
这个与软件测试中的单元测试类似,最终结果也是从中间结果来的。只有深入了解代码的中间结果,才能获得更多的观察, 有办法 进行改进。
9.5论文的创新
创新性是论文的核心,那么应该如何评价论文的创新?
1.选题新
包括:别人没有研究过的,即学科前沿问题;研究过了但没有研究透的;看似研究透了但仍有矛盾分歧的;应该予以纠正、补充或 需要重新审视的问题。
2. 材料新
新材料可以是文献资料上的,也可以是挖掘、试验或调查得来的。一种是学界没有发现过的全新材料,一种是针对所研究的主题以 往从没有使用过的既有材料。
3. 方法新
包括新创造的方法,以往研究没使用过的方法,或者首次从其他领域引入到本领域的方法。方法创新也可以是看问题的新角度,表 现为文章使用的一些新理论新框架。
4.观点新
观点新是内容上的、实质上的,而不是形式上的,把旧观点改换文字表述还是旧观点。新观点应该发前人之所未发,并具有一定的 学术价值和现实意义。
怎么实现论文的创新呢?创新点的体现与所研究的问题是息息相关的,也就是体现在问题意识中,而问题意识往往体现在行文结构中。
1.提出新问题
要在论文中提出新问题,使创新点成立,需要论证清楚几个问题:
为什么是新问题?怎么证明?
新在哪里?与旧问题有什么区别?
2.成立新视角
用新视角写作的论文需要解决:
针对该问题以前的研究用的是什么视角?使用新视角的原因是什么?
旧视角存在什么缺陷?新视角可以解决这些缺陷吗?怎么解决的?
3.提出新见解
当前研究存在哪些见解?
你提出的见解是什么?新在哪里?
4.使用新方法、新材料
新材料、新方法的优点何在?
目前该问题还存在什么缺陷?
你的新材料、新方法应该刚好可以解决这些缺陷。
论文创新点并不是要你有什么前所未有的发现,或做出什么惊为天人的研究,本质上,只需要找出你的论文与前人研究的不同。
9.6参考文献
参考文献隐藏的错误数量远超乎你的想象,Latex提供了 bib 文件进行参考文献的管理,参考文献不要从网上直接复制,正确的做法是使用一个正确的模板, 然后把文献的内容填进去。
将符号进行列对齐。
名字要有意义。
名在前,姓在后。"Fang Huang"不要写成 "Huang Fang",并且作者名字不要进行缩写。
注意题目的大小写,可以用花括号强制设置。如 "ITUFP: A fast method for interactive mining of Top-K frequent patterns from uncertain data"应写为 "{TACS: T}hree-way active learning through clustering selection"。
会议名如果使用简称,就不要再写全称。
特殊字符需要使用转义符才能正常显示。
千万不要把特殊字符 (包括全角的引号,头上戴点的字母等等) 拷贝进 bib 文件。bib 文件和 tex 文件都应该只含基本的 ASCII 字符。
除最后一行外,其它行应以逗号结束。
为了保证格式的正确性,应检查生成的 pdf 文件。
10.小结
以上是我对《论文写作》这门课程的总结,按照闵老师的模板,每个部分该写什么,怎么写,讲解得清清楚楚,每一条看似简单,实则真正去写的时候,是十分困难的,万事开头难嘛。如果你看到了这个帖子,就从你读的每一篇论文开始找灵感,尝试写一写吧。在写的过程中,需要根据这些内容不断自查和总结。一篇好的论文是改出来的,需要我们对其不断地进行润色,如果你这么做了,下一个幸运儿就是你啦。
最后,再推荐一波闵老师的博客,你想要的都在这里!!!