目录
- 前言
- 论文写作 1:学术论文的基本概念
- 论文写作 2:常见的Latex格式文件
- 论文写作 3:慎用的单词与短语
- 论文写作 4:彻底解决英文句子的语法问题(好的中文=好的英文)
- 论文写作 5:符号系统与数学表达式
- 论文写作 6:给自己的论文一个中肯而闪亮的题目
- 论文写作 7:摘要10句
- 论文写作 8:关键词的写法
- 论文写作 9:引言需要讲述完整的故事
- 论文写作 10:文献综述不可进行简单的罗列
- 论文写作 11:理论部分全靠数学功底(含实例)
- 论文写作 12:算法伪代码(含实例)
- 论文写作 13:实验部分是重头戏
- 论文写作 14:结论不要太罗嗦,但进一步工作可以
- 论文写作 15:参考文献部分隐藏的错误数量超过你的想象
- 论文写作 16:图片与图摘要
- 论文写作 17:Latex表格的控制
- 论文写作 18:审稿意见回复要直截了当
- 论文写作 19:会议论文与期刊论文的区别
- 论文写作 X:不可原谅的低级错误
- 其他
前言
学完闵帆老师的《论文写作》后,感觉自己在论文方面的很大部分问题都得到了解决,从一个懵懵懂懂的小白,变为了略知一二的小白。总的来说,这门课不仅教会了我写作论文的技巧,也教授了我一些人情世故。因而用此篇博客来记录和总结重点以及一些心得,以便后续写作时参考。闵帆老师《论文写作》专栏地址如下:https://blog.csdn.net/minfanphd/category_11436381.html?spm=1001.2014.3001.5482,可按需进行查看和学习。
论文写作 1:学术论文的基本概念
- 学术论文是对研究工作的阶段性总结,内容不需要太多,创新点一两个就够。
- 论文不需要文采,只需要正确的内容放在正确的位置。
上这门课之前总觉得创新点越多越好,现在才知道不是这样的。之前也觉得论文不就是自己的东西加一点润色写上去,只要表达清楚了不就可以了,后来才知道格式的要求也很严格,而且不同的期刊要求和模板还不一样,虽然大体的写作内容是差不多的。 - 学术论文的写作越早越好。
论文居然是工作还没完成之前就开始写的,这是我没有想到的。我一直觉得,工作没完成就写不出来,但老师一说又觉得好像是这样,那些背景意义以及研究现状什么的不就查找文献阅读文献的时候就可以写了么;实验的话,可以在做实验的时候或者说在测试自己的方法可行之后就可以着手写,这样的话,不会存在后面又花时间去重复前面的工作。
论文写作 2:常见的Latex格式文件
- 每种期刊都会提供一个或多个格式文件. Latex 源文件只需要进行少量改变, 就可以获得完全不同的版面。
- Latex的使用虽然比Word复杂,但选择好模板后Latex在格式方面比Word易于调整。
- 最好找该期刊已录用论文的源文件,其次找该期刊提供的模板文件。
因此,确定想要投的期刊后,可以先看看该期刊录用的论文源文件,没有的话看看其模板文件。这么做可以尽可能的保证所写论文符合该期刊的规范,从开始就注意写作规范的问题可以避免日后因格式问题打回修改的麻烦。
论文写作 3:慎用的单词与短语
- 一般而言, 未出现在任何学术论文中的单词, 不可以使用。
- Novel与New:小改变用new,大改变用Novel。投不怎么样的期刊的用new,投核心用Novel。
- 使用 https://www.linggle.com 查看单词或词汇的使用频率,来确定使用哪种表达。
我们平时常见的** don’t 以及 isn’t **等等,这些简写的单词都不应当出现在论文中,但 authors’ 这类必须使用的情况出现才是可以的。并且,一般使用常用的表达,往往使用论文中出现频次更高的表达,比如: “related work” 比 “related works” 使用的频率更高,因而更常用前者。
论文写作 4:彻底解决英文句子的语法问题(好的中文=好的英文)
- 总结句式是解决语法问题的正解
- 借鉴法——找顶刊->找出其中各个部分的简单句子->获得句型->自己用。
- 倒腾法——英->中->英->中->英->中->英……
感觉借鉴法主要是把别人好的东西拿来用嘛,倒腾法就是训练自己的英语写作能力。借鉴法比倒腾法感觉更省力,因为借用别人的已经被人认可的内容,比你自己琢磨出一套让人认可的方法来的容易,并且不太容易出错。一般借鉴法主要是借鉴顶刊的内容。
论文写作 5:符号系统与数学表达式
- 对于某一个研究小组, 符号系统总结好了, 就可以重复使用。
- 如果论文涉及不少数学符号, 应该给出一个符号表, 便于读者查阅。
- 严禁先用Word里的公式编辑器写数学公式,再转到Latex,这样容易出现问题。
这一部分感觉格外考数学功底,目前让我写个式子勉勉强强还可以,但要解释清楚,可能就相当于要命的程度了嘞。目前连算法正确性证明都难以写通的人,可见数学表达之薄弱。因此,就别手欠去改式子格式,比如:看心情加减空格之类。建议一直使用Latex,写数学表达式优势很大,从开始就用Latex直接一步到位,避免写着写着出现麻烦。还需要注意的是,不同字体的同一字母表达含义不同,需要确保整篇论文的符号保持一致性。集合、数组、向量应使用粗体。看看已经发表的论文的.tex 文件学学表达式。
论文写作 6:给自己的论文一个中肯而闪亮的题目
- 有吸引力
- 易于理解
- 易于检索
- 长度控制在 40-60 个字母
题目越短代表创新性越高,越长表示限定多,适用范围较为局限,创新性偏低。 - 尽量不使用 based on
- 使用 with,through 等来表示技术
- 论文重点在算法,题目缩写为算法名称
之前看的论文有使用 via 来表示使用到的技术,由此可见使用技术的表达方法可以多样一点。如果使用based on可能会使读者误以为你的论文只是一个简单的拓展或应用,因而能不用就不用。好的题目不仅能让审稿人眼前一亮,就跟两个人谈恋爱一样,在没有发现对方内在是什么样的时候,美好的外在能够增加吸引力,从而想要更深入地了解其内在品格。
论文写作 7:摘要10句
- 问题及其重要性。
- 已有工作。
- 已有工作局限性。
这两部分感觉主要是简要地写国内外研究现状,以及结合已有方法谈论目前存在的问题。 - 本文工作。
- 本文方法的第 1 个技术/步骤/方面/优势/贡献。
- 本文方法的第 2 个技术/步骤/方面/优势/贡献。
- 本文方法的第 3 个技术/步骤/方面/优势/贡献。
这三点贡献啥的,编也要编出来,如果没有这么多,那会显得工作量太少了,过审的可能性就会大大减小。 - 实验设置。
- 实验结果。
- 提升。
按照以上后十个的方法来写论文摘要,能够保证字数和质量都能满足条件。格式化的摘要模板能够保证论文摘要能符合要求,让审稿人感觉投的论文次数已经很多了,非常老练,增加印象分。反正论文也不需要在格式上进行创新,都按照这个模板写,也不会让审稿人觉得很死板,因为也不是次次都能投上。
论文写作 8:关键词的写法
- 关键词一般看作摘要的一种补充
但我感觉关键词有时也会简单概括论文方向和方法,似乎是为了便于检索吧。 - 一般需要 3-5 个关键词
- 关键词一般由 1-3 个单词构成
- 需要将关键词按照字母表顺序排列
这个看论文的时候都没太注意,一般没太看这个,主要是看内容去了。但一般检索的时候会稍微用到一些。 - 有些期刊支持两类关键词
论文写作 9:引言需要讲述完整的故事
- "引言"的本意是为论文作一些铺垫, 然而, 在计算机英文论文中, Introduction 需要讲述完整的故事
- 引言的层次
1 没有拼写、语法错误(单词级)
2 表达简洁、得体、有力量(句子级)
一个意思用尽可能短的句子描述。不需要太多的句式,少数的几个重复使用即可。
3 丰富(段落级)
同一事情从不同的角度分析,有一些常用的角度、招数为 WWH: what, why, how
4 条理清晰,节奏明快(章节级)
5 创新
摘要相当于论文的宣传片,而引言则相当于论文的剧本。写引言最八股的方式就是将摘要的每一句拓展为一段,而每一段应该在 5-10 句左右,每段50-100个单词。还有些会议或者期刊会要求作者单独把自己的贡献列举出来,同摘要一样,两三点就可。引言的最后一段以 The rest of the paper is organized as follows。
计算机领域(特别是顶会)流行开局一张图,而论文就应该对这张图进行解释。
论文写作 10:文献综述不可进行简单的罗列
- 绝大多数的参考文献应该在文献综述中引用
- 不应该将参考文献的引用作为句子的主语或者宾语等
- 不要一次性引用太多文献,也不要全句进行引用
大部分文献的引用感觉实在国内外研究现状,比如谈到现有技术的优缺点时,以及自己所使用的方法是对某某算法的改进时,需要引用到较多的文献。引言中描述需要省略一些,而相关工作部分要稍微详细一些,并且相关工作应该是对引言部分的详细描述,而不是简单地重复。全句引用会导致重复率过高,并且会感觉很多东西不是你自己的。可以综述自己的前期工作,但一般需要控制在2-3篇的样子。
论文写作 11:理论部分全靠数学功底(含实例)
一般性准则如下
- 理论应该完备。
- 符号要保持同一风格。
- 重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary,,附属于算法的叫 property。
例子见:论文写作 11: 理论部分全靠数学功底 (含实例)_闵帆的博客-CSDN博客 这些数学定理格式是深度学习必修课,都逃不掉的,毕竟是搞深度学习方向的,就别想着一步登天了,脚踏实地比什么都好。不要害怕,打好基础,勇敢面对,都是纸老虎罢了。
论文写作 12:算法伪代码(含实例)
- 需要说明输入输出
- 方法(函数名)可写可不写,被其他方法调用就必须写
- 需要写出主要步骤的注释
- 长度在15-30行
- 可使用数学式子或对已有数学式子的引用
- 一般需要进行时间、空间复杂度分析,并写出配套的property以及相应的表格
实例见:论文写作 12: 算法伪代码 (含实例)_闵帆的博客-CSDN博客_论文中的算法伪代码
这部分感觉主要是设计算法的论文的重点,特别是时间复杂度和空间复杂度,这部分应该是新设计的算法的必要的分析。若是在深度学习领域方面,一般很少有对算法进行在时间或空间上的改进,一般是针对于精确度或者速度方面的提升进行的改进。
论文写作 13:实验部分是重头戏
1.数据集部分
- 数据集越多, 覆盖领域越广, 结果就越可信
- 数据集大些更好
- 获取自己主要参考文献中的数据
2.自问自答模式
采用自问自答的方式,在实验之前提出问题,实验结果列出之后再对前面的问题进行回答。但有些审稿人不喜欢这种模式,他提出再进行修改。
3.内部比较
一是,参数太多会导致分不清重点,这时候可以选几个影响稍大的几个参数来进行讨论;二是,有时候我们会有好几种备选的方案,此时就需要进行他们内部的竞争,择优选取,看哪一种方法实现效果或者说实验结果更好。
4.外部比较
在分析自己方案优势之余, 也应该分析它的劣势, 否则审稿人不干. 因为机器学习的基本规律就是 No free lunch, 即一个方案既然有优点, 就肯定有缺点. 既然有擅长的数据/指标, 也就有不擅长的数据/指标.
这一部分是论文的关键,重点在于实验比较的方法,以及在各类数据集上的试验,这就要求比较的方法是目前所研究领域较新的成果,数据集可以是比较经典的数据集,也可以使用参考文献中使用到的数据集。最后的实验结果要在当前来看是好的,才算有意义,不然等于没有效果,所以需要关注最新发表的论文是否对研究的领域有了新的进展。
在重复别人的实验的确也出现了结果不一致的情况,可能因为环境版本的原因,也有可能有些配置什么的没有提及,导致有些参数或者数值不同,从而实验结果与别人不同。论文一半左右的篇幅都是围绕实验过程来写的。切忌数据造假,网络发论文一发表就是一辈子,与其一辈子担惊受怕不如从一开始就踏踏实实。
论文写作 14:结论不要太罗嗦,但进一步工作可以
- 结论一般不要太长
- 避免使用与摘要中相同的句子
- 可以说明进一步工作,列3-5条
读者可能比较关注后续工作的那部分,因为这可以提供一定方面的思路或者提供一个研究的方向,从而进一步进行研究或优化。例子在:[论文写作 14: 结论不要太啰嗦, 但进一步工作可以]。(https://blog.csdn.net/minfanphd/article/details/121951404)
论文写作 15:参考文献部分隐藏的错误数量超过你的想象
- 千万不要直接使用网上的 bibitem。
- 将等号进行列对齐。
- 名字要有意义。
- 名在后,姓在前。
- 作者名不要缩写。
- 注意题目的大小写,可以用花括号强制设置。
- 期刊的名字按照正常方式写即可。
- 会议名如果使用简称,就不要再写全称。
- 由于有 year 域,不要在会议后面再加年份。
- 页码之间应使用两个连词符 -,最终的效果就是一条比较长的横线。
- 特殊字符需要使用转义符才能正常显示。
- 除最后一行外,其它行应以逗号结束。
- 有些作者喜欢在名中间连词符。
- 为了保证格式的正确性,应检查生成的 pdf 文件。
应该在最开始的时候养成良好的写作习惯,需要保证格式正确,不然会有一些隐藏的问题。最好是一开始就使用正确的模板,然后把文献内容填补进去,这样可以避免很多问题。可以直接用Latex的bib文件进行参考文献管理比Word、Wps方便太多了,一步到位。
论文写作 16:图片与图摘要
- 尽可能使用矢量图。这样在放大的时候就不会失真。
- 不要使用 Excel 画图, 太丑了。
- 图注可以相当长。
- 一般而言,引用图片时,应保持与图片编号的一致。
- 有些期刊要求提供 Graphical abstract,即使用一张图 (含图注) 把论文的主要思想介绍清楚。
一般不用彩图的原因是成本太高了,它太贵了呀。有些期刊印彩图要200个馒头才印一张,对于咱们这些穷学生来说,能避免支付这种不是必需的项目就尽量避免,土豪随意。比如:图表不同变量的区分不用不同颜色,而用不同的形状(三角、圆、方)去替代,尽可能保证即使将图打印成黑白的也能表达意思。做好一个图片不是一天两天就能完成的,需要长时间的雕琢,甚至一个月做好一个图片都不足为奇。好的图片能让读者如沐春风、心旷神怡。
论文写作 17:Latex表格的控制
- 表格一般应该与文字边距相同
- 对齐方面, l 表示 left,c 表示 center, r 表示 right
- 示例:论文写作 17: Latex 表格的控制_闵帆的博客-CSDN博客_latex 表格
- 所有列都为左对齐,使用 0.0000 而不是 0 来保证对齐。
- ± \pm ± 用于显示标准差,使用下标以节约版面。
- 粗体指示最好的效果,斜体指示次好的效果。
- Meanrank 指示不同数据集的总体效果。
- 数据集应按照某种方式排序,如对象数、属性数、来源领域等,并保持所有表格中的顺序一致。
- 大于 1000 的数据应该用逗号隔开,如 1,024。
- 作为良好的习惯,源码里面也应该对齐,而不要因为不影响最终 pdf 效果而偷懒。
做表格一定要实事求是,千万不要擅自修改、伪造数据。表格也一定要整齐,让审稿人看一眼能让精神舒服。不要歪歪扭扭的,让审稿人不舒服就是给自己找事。
论文写作 18:审稿意见回复要直截了当
- 思想上务必要端正态度,编辑和审稿人花大量时间义务审稿不是想为难你,而是来帮助你改进论文质量。
- 问题应该直接回答,而不要顾左右而言他。
- 回复不要太长,正文中进行相应的修改才是重点。
- 正文中修改部分应用蓝色字标出。
回答要跟问题标号对应,如果问题没标号可以自己标一个。回复要做到“点对点”,问什么答什么。打回来修改说明审稿人觉得有机会,要怀有感恩的心。审稿人提的小建议不要回复冗杂的客套话,小建议直接说“Suggestion accepted”就行,简单干脆也不浪费审稿人时间。千万不要把自己找到的但审稿人没发现的小问题写进回复里,审稿人会觉得我之前交为什么不自己检查一下,要给审稿人一种我已经检查了很多遍,凭自己已经发现不了问题所在的感觉。
论文写作 19:会议论文与期刊论文的区别
- 论文被会议录用后,适当增加一定 (如1/3) 的新材料,可以再投到期刊。
- 会议没有章节组织描述。
- 会议相关工作描述比较少。
- 会议实验比较少。
- 会议不讨论 future work。
- 会议参考文献较少。
会议投中后转期刊需要给期刊进行说明,避免学术不端的风险。可以先提前写好期刊论文,再根据会议论文的要求进行修改。
论文写作 X:不可原谅的低级错误
- 大小写。
- 标点符号后面缺少空格。
- 标点符号前面多了空格。
- 小括号前少了空格。
- 参考文献引用的方括号前少了空格。
- 连续几篇文献的引用之间多了空格。
- 左单引号是在键盘左上方,Esc 键下面,即 `。两个左单引号就变成一个左双引号。右双引号一般使用两个单引号生成,在某些系统上 ,也可以用双引号本身获得,但不具有通用性。
- 符号应规范,且保持同一篇论文中的一致性。
- 严格禁止使用 Word 的公式编辑器写式子,然后转到 Latex 源文件。那种方式有太多的额外控制,导致不规范。
- 如果一个数学表达式是一个句子的结束,应在末尾打个句点。
- 如果一个数学表达式还没把话说完,应根据后面的情况选择相应的符号。
- 如果式子里有分情况讨论,应正确使用逗号,分号。
- 注意是否存在重复的标签与缺失的标签。
- 不使用过长的句子。学术论文的主要功能是进行读者与作者之间的交流,句子太长影响阅读。
- 检查是否存在类似缺少主语的不完整句子。
- 检查基本语法、单复数、三单形式。
- 同一词组在同一句子中避免重复出现。
- 强调文字使用 \emph,如果使用 $ 符号括起来就错了,后者有更大的间距,很容易看出。
- 注意表格宽度。
- 数学表达式宽度不应超出文字宽度。这里既包括编号的数学表达式的,也包括在文字中间未编号的表达式。
- 图片要用矢量图。
- 流程图要按照标准画。
前几次发论文的时候多检查检查排除低级错误,低级错误太多审稿人直接打回,写论文要有耐心,慢慢完善。论文的发表不仅仅需要扎实的内容,同样也需要完美的格式规范,二者缺一不可。
其他
除了以上这些主要模块以外,闵帆老师还在《论文写作》中有其他内容的博客,如:如何评价论文的创新;硕士开题所需要考虑的几件事情等等,我觉得这些都还挺实用的,对我目前来说帮助也蛮大,至少可以明确目前应该做什么,朝那些方向去努力,或者说需要在那些方面下功夫。