论文写作
论文写作
\quad \quad 本博客的内容来自闵帆教授的论文写作课程学习,为初步版本,后续也会根据自己写论文遇到的问题感受完善此博客。闵帆教授博客【点此处】要更具体全面,也有不少关于本硕博学术论文、毕业论文的建议,欢迎大家前往学习。
1. 学术论文的概念
\quad \quad 根据老师的课程总结,学术论文应该是自己某一阶段工作的总结。但是一篇论文的创新点1-2个,论文贡献可以更多,但是贡献的内容不一定是创新但包括了别人没做过的东西。同时,论文的创新点1-2个我觉得也是增加文章可读性,才能在有限的篇幅内将工作阐述清楚,所以如果有一系列的发现应该按照上方的原则将其分解为多篇文章。
1.1 如何写学术论文
\quad \quad
关于如何写这个问题,在起步阶段肯定是没有一个很好的习惯以及水平,解决的办法就是多读论文,虽然可能论文的格式(排版)会有差异,但是逻辑框架是相似的,只有多读论文才会逐渐熟悉。当然我们说的论文分为会议论文和期刊论文两种。
\quad \quad
期刊论文的审稿周期是会长于会议的,所以经过长时间的修正出现漏洞的可能性越小,当然会议也很牛,只是单说可能性,闵老师的推荐是读期刊。但是会议也有好处,顶会似乎都会开源代码,期刊不一定。
\quad \quad
读什么期刊会议参见:中国计算机学会(CCF)《计算领域高质量科技期刊分级目录》,优先顶会顶刊。
1.2 论文创新
- 老问题老方法:两个成熟的领域的套用
- 新问题老方法
- 老问题新方法
- 新问题新方法
1.3 什么时候开始写论文
\quad \quad 越早越好,老师说最晚研一下学期就要动手写论文,否则很难毕业,意味着实验应该尽快开始了!
1.4小结
\quad \quad 论文写作是科研人员日常生活的重要部分。
2. 论文写作公式(Latex格式)
\quad \quad 在写论文中逃不过Latex表达式,这是最好用的写数学表达式的方法,在本节我将会记录自己常忘记的Latex表达式。同时国际期刊会议都会提供相应的Latex模板,只需要经过少量的修改就可以得到相应的版面,这部分参考自闵帆教授博客。
2.1 常用Latex表达式
\quad \quad 此处记录常用但记不太住的Latex表达式。
2.1.1 关系符号
符号 | 语法 | 符号 | 语法 |
---|---|---|---|
∼ \sim ∼ | \sim | ≠ \neq = | \neq |
≡ \equiv ≡ | .\equiv | ≫ \gg ≫ | \gg |
∈ \in ∈ | \in | ∋ \ni ∋ | \ni |
∀ \forall ∀ | \forall | ∃ \exists ∃ | \exists |
≥ \ge ≥ | \ge | ≤ \leq ≤ | \leq |
2.1.2 运算符号
符号 | 语法 | 符号 | 语法 |
---|---|---|---|
∇ \nabla ∇ | \nabla | ∂ x \partial{x} ∂x | \partial{x} |
d x \mathrm{d}x dx | \mathrm{d}x |
3.论文
3.1 标题
- 必须有吸引力
不炫的论文题目审稿人看了没兴趣, 不炫的博客题目阅读量肯定不高.对于计算机方面论文而言, 应该写出自己提出的新问题或新方法. 新问题应该有意义而且有挑战性, 新方法则应该高效或准确. - 必须易于理解
术语和其它词汇应该在该领域内常用, 不应该要求读者借助词典才能理解. - 应该易于检索
流行的术语有助于被别人搜索到, 也能帮助提高论文的被引频次. 对于一个学者而言, 论文引用次数比论文数量更重要. - 长度最好控制在 40-60 个字母之间
越短表示创新性越高, 如rough sets, fuzzy sets 等等. 如果你敢写这么短的题目而且能被录用, 也不需要从本贴学到任何东西了.
越长表示限定越多, 适用范围越窄, 创新性越低, 读者也就没啥兴趣了. - 尽量不使用 based on
如果这样写, 读者会觉得该论文只是已有方法一个简单的扩展, 或者简单的应用. 有些中文期刊明确要求论文题目不要使用 “基于”, 因为这种题目泛滥.使用 through, with 等来表示技术 - 如果主要贡献为算法, 题目的缩写就应该为算法的名称
3.2 摘要
\quad \quad
从中文的角度, "摘要"就是把论文重要的内容摘录出来; 从英文的角度, Abstract 就是把重要的内容抽取出来. 它通常包括三个部分: 已有工作的评述, 本文工作的描述, 实验结果. 有些期刊明确要求按照 Background, contribution, experiments 三个方面描述。
具体分析:
- 问题及其重要性:本句可以说明问题所属的领域, 解释最重要的概念, 或者强调问题的重要性.
- 分析: 针对性强, 有营养.
- 已有工作:本句可以描述该问题的流行解决方案.
- 已有工作局限性:本句以 However 开头, 需要注意
- 指责不要太强烈, 要尊重别人的劳动;
- 本句干的事情是挖坑, 要保证自己的方法能把坑填上;
- 实在不行也可以不写本句, 但这样显得没有底气.
- 本文工作
- 以 In this paper 开始
- 是题目的扩展
- 出现算法的缩写
- 本文方法的第 1 个技术/步骤/方面/优势/贡献
- 本文方法的第 2 个技术/步骤/方面/优势/贡献
- 本文方法的第 3 个技术/步骤/方面/优势/贡献
如果不能扯出 3 个方面, 论文的工作量就显得不够 - 实验设置
- 给出数据的领域、来源、数量.
- 实验结果
- 提高了准确性、效率等等.
- 提升
- 吹嘘一下论文的意义: 为该领域打开一扇门之类
3.3关键词
\quad \quad 同时在现代搜索引擎出现之前,关键词是用于检索论文的一种重要的方式。现在关键词可以让读者快速知道本文的关键技术点。
- 关键词常被看作摘要的一种补充
- 一般需要 3–5 个关键词
- 关键词一般由 1–3 个单词构成
- 将关键词按照字母表排序
- 有些期刊支持两类关键词
- index term: 由期刊提供, 只能从投稿网站给定的列表选择
- keywords: 作者自己按需写
3.4 引言
\quad \quad "引言"的本意是为论文作一些铺垫, 然而, 在计算机英文论文中, Introduction 需要讲述完整的故事(论文整体流程)。
- 引言在计算机科学研究论文中需要提供一个完整的故事,它应该是对整个故事的详细描述。一篇写得好的引言可以极大地影响评论者的判断,通常引言也会影响读者是否引用该论文。
- 如果引言有一张图,那么之后就应该围绕这张图进行展开描述。
- 结构和风格:
- 引言应遵循与摘要相同的节奏。
- 摘要的每句话都可以在引言部分扩展成一个段落。
- 每个段落应该有5-10个句子,50-150个单词。
- 短段落应该合并,长段落应该分开或减少。
- 在引言中使用视觉效果,如图表,可以帮助读者理解论文的主要内容。
Note:引言应该没有拼写和语法错误。 它应该简洁、恰当、有影响力。 用短句来描述想法。 从不同的角度分析同一个想法。 保持清晰和快节奏的结构。
3.5 文献综述(Introduction)
绝大多数的参考文献都应该在文献综述中被引用。
- 文献综述的作用和重要性:文献综述是对前人工作的尊重,也方便读者查阅和理解研究技术的细节。
- 文献综述的布局:引言中一般简略描述,而第2节的Related work则需要详细描述。需要注意避免重复描述。
- 文献综述的分类介绍:文献需要分门别类介绍,便于读者理解研究工作的位置,可以从大类套小类逐步细化。
- 引用参考文献的方式:引用参考文献时,不应作为句子的主语、宾语等,而是将完整的句子写好后再添加参考文献的引用。不推荐一次性引用太多文献。
- 合理评述相关工作的优缺点:在综述相关工作时,可以夸大优点,但避免使用口语;谈及缺点时要中肯、客气,同时可以综述自己前期的工作,但控制在2-3篇论文之内。
3.6 算法数学理论
\quad \quad
数学表达式是可以用最简洁的符号表达出最精确意思的一种语言。大家都应该逐渐习惯用数学表达式来表达,这样对读者也更友好。这里闵帆教授分享了自己的经验数学表达式魔训,同时,也可经常看《离散数学》的教材熟悉表达式的书写。
\quad \quad
一般数学表达式的书写有如下几个准则:
- 理论应该完备
- 符号要保持同一风格
- 重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary, 附属于算法的叫 property.
3.7 算法伪代码
\quad \quad 算法伪代码是论文的核心之一,其他部分介绍算法原理等,那么伪代码就是一个能够快速了解算法实现的整个流程的地方。下面是伪代码书写的几个准则:
- 需要说明输入、输出;
- 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;
- 需要写出主要步骤的注释;
- 长度控制在 15-30 行;
- 可使用数学式子或对已有数学式子的引用;
- 不重要的步骤可以省略;
- 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准.
3.8 实验(experiments)
\quad \quad 实验结果是最能证明论文前方理论叙述有效的部分,故必须足够充足以至于使人信服! 这就涉及到数据集和实验对比这两大模块。
3.8.1 数据集
- **数据集越多, 覆盖领域越广, 结果就越可信。**具体数量根据领域决定(抄好论文作业,他们几个你就几个,甚至更多,但是注意别只看数量,不看数据集覆盖领域)
- 获取自己主要参考文献中的数据, 有利于进行比较。
3.8.2 如何描述实验
\quad \quad 实验的主要目的是回答一些作者和读者关心的问题. 因此, 我采用自问自答的方式, 在实验之前提出这些问题, 在实验结果列出之后逐个回答它们.
3.8.3 实验对比
\quad \quad 这部份分成两个部分:内部对比和外部对比,效果应用图表进行可视化展示(要客观)。
- 内部对比:自己设计的算法不同参数变量如何设置,在不同取值时的不同结果,如何设置能得到最优值
- 外部对比:设计的算法与经典算法或者领域baseline的效果对比,证明自己算法效果更好或其他方面。
3.8.3.1 图表
\quad \quad 大部分图标都会出现在这个部分,那就在这里展开说一些规范和注意事项。
- 尽可能使用矢量图,这样在放大的时候就不会失真。 visio, matlab, python 生成的图都可以存为矢量图。
- 围绕图的说明性文字应该比较长它占的版面应不低于图片本身版本的 1/2(一定要把图的内容解释的一清二楚)。 通常对图的说明应该是一个或多个完整的段落, 且使用 Figure 1 illustrates 这种开头 。
- 彩图出版很贵。应保证你的图片打印成黑白的仍然可以表达自己的意思(高对比色)。
- 有些期刊要求提供 Graphical abstract:即使用一张图 (含图注) 把论文的主要思想介绍清楚。
3.9 结论
\quad \quad 有句话说“看一篇论文的摘要和结论就大概知道这篇论文适不适合自己”,下方是达到这个水平的一些建议(这或许也会很大影响被引用否)。
- 结论不要太长, 5 句就够了。如果想讨论的内容比较多, 应该在本节之前加入一个单独的 Discussions 小节.
- 避免使用与摘要内相同的句子。摘要里面说我们做了哪些事情, 而这里应该说我们获得哪些观察与结论。
- 进一步工作(可无)。可以列出 3 至 5 条, 不算在 Conclusion 的字数里面, 读者很可能非常关注这一部分, 因为他们可以按照这种思路继续进行研究。
3.10 参考文献
\quad \quad
参考文献的格式十分重要,不过不同的期刊或者毕业论文之类的会有不同的标准要求,建议仔细检查论文PDF,尽力避免这方面的小错误。
\quad \quad
参考文献的数量也应该适量,能够支撑论文的观点和论据,不要过度引用。