本篇博客是对闵老师讲授的《论文写作》这门课程的总结。这门课程对于论文写作进行了多方面的讲解,通过这次课程的学习我对论文写作有了进一步的理解和体会。
目的
1. 目的
研究的目的是发现新知识、发明新技术。
写论文的目的是把你的工作告诉同行,经过同行评审(peer-review),成为科学文献。
基础研究通常离实际应用有较大距离,只有很少的研究工作能很快进入实际应用,所以我们目前发出的论文可能还并不能应用到实际环境中。
一般研究的发展为:前沿研究 -> 实验室成熟技术/工业界新技术 -> 工业界成熟技术
2. 如何做研究
TPIC:Topic -> Problem -> Idea -> Concrete work (theoretical analysis, experiments, etc.) -> Paper writing -> Submit
2.1 Topic
- 通常情况:根据导师给出的topic来选择(自己的兴趣,自己的知识结构,能否获得必要的资源)。研究领域不存在“好”、“坏”之分,只要做得足够深入,都能做出好的工作;
- 然后,阅读关于该话题的重要文献,了解该话题的研究历程、研究现状。请导师或该领域资深学者推荐读物,基于导师推荐的读物,顺藤摸瓜(例如从参考文献)找到尽可能多的重要文献读不懂的先跳过去,多读几遍;
- 需要自己去找topic、自己找东西读,则:
1: 找人请教(自己要加以判断):师兄、师姐、该领域的著名学者
2: 自力更生:搞清楚自己的领域里最重要的刊物、会议;找来那上面最近几年的文章读。
2.2 Problem
- 导师给问题;
- 自己产生问题,导师帮你判断;
- 完全自力更生;
读发表在重要刊物和会议上的有关的topic的文献(2、30篇读下来大概能知道有哪些问题是没解决的了),关注这个topic上活跃的leading expert的工作、他们的文章中可能会指出一些需要解决的重要问题
有了问题以后:
- 搞清楚该问题上已经有过的所有工作
- 导师推荐重要文献,然后自己顺藤摸瓜
优点是什么?缺点是什么?为什么没有彻底解决问题? - 悟出已有工作的发展线索
2.3 Idea
判断idea:
- 是新的idea吗?
- 是不是有道理?(不是瞎蒙出来的)
- 是否可行?
- 把这个idea先放到一边,过一周再考虑一下:是否有更好的办法?
2.4 Concrete work
- 理论分析
周全、不要有漏洞
尽可能简单的工具 - 实验验证
实验方案周全仔细
基准测试
其他学者也能使用的数据
不可缺少的比较
实验是可重复的
3. 如何写论文
3.1 Title
- 要有吸引力
我们一般的论文,首先要过的就是审稿人的那一关。没有吸引力的题目,审稿人也不会感兴趣。 - 要容易理解
术语和其它词汇应该在该领域内常用, 不应该要求读者借助词典才能理解. - 尽量运用一些容易被检索到的方向的词汇
流行的术语有助于被别人搜索到, 也能帮助提高论文的被引频次. 对于一个学者而言, 论文引用次数比论文数量更重要. - 长度最好控制在 40-60 个字母之间
越短表示创新性越高,越长表示限定越多, 适用范围越窄, 创新性越低。 - 尽量不使用 based on
如果这样写, 读者会觉得该论文只是已有方法一个简单的扩展, 或者简单的应用. 有些中文期刊明确要求论文题目不要使用 “基于”, 因为这种题目泛滥. - 使用 through, with 等来表示技术
- 如果主要贡献为算法, 题目的缩写就应该为算法的名称
3.2 Abstract
- 问题及其重要性:背景介绍,说明我们做的是什么方向,能解决什么问题。
- 已有工作:陈列出目前该方向已经有的工作(一两个即可),陈述完后用However转折接第三句(不可用But)
- 已有工作局限性:总结出上面已有的工作存在的缺陷
- 本文工作:提出自己的工作。
- 分步骤陈述自己的工作(首先、其次、最后)
- 实验结果:陈述自己的工作效果(如提升了某某指标)
3.3 Keyword
关键词常被看作摘要的一种补充
- 一般需要 3-5 个关键词
- 关键词一般由 1-3 个单词构成
- 将关键词按照字母表排序
- 有些期刊支持两类关键词
index term: 由期刊提供, 只能从投稿网站给定的列表选择
keywords: 作者自己按需写
3.4 Introduction
- 它应该对整个故事进行详细的描述
- 最八股的方式, 就是采用与摘要相同的节奏. 摘要的每一句, 都扩展成引言中的一段.
- 每段应有 5–10 句.
- 计算机领域 (特别是顶会) 流行在引言里面放 “开局一张图”
3.5 Related Work
-
放置位置
第 2 节专门的 Related work: 描述得比较详细
实验之后: 不想破坏自己论文的完整性, 特别是有 Preliminaries 一节时, 可考虑放到这里 -
分类介绍
便于读者理解你这项工作的位置 -
参考文献的引用一般仅仅是一种附属品
先写一个完整的句子, 再把参考文献的引用加上去. -
不应将参考文献的引用作为句子的主语、宾语等
-
以年份为主线的综述也不值得提倡
-
不要一次性引用太多文献
一次不要超过 3 篇, -
不提倡全句引用
-
合理评述相关工作的优缺点
3.6 The theoretical part
理论应该完备,符号要保持同一风格。
重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary, 附属于算法的叫 property。
3.7 Algorithm
- 需要说明输入、输出;
- 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;
- 需要写出主要步骤的注释;
- 长度控制在 15-30 行;
- 可使用数学式子或对已有数学式子的引用;
- 不重要的步骤可以省略;
- 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准.
3.8 Experiments
在实验开头例几个问题,并在实验中回答。
(1)体现自己的方法比别人好;
(2)参数设置是否适合不同数据集;
(3)运行时间是否与之前的复杂度分析一致。
然后用一段话描述本文用的数据集,并且用表证明。
Performance Comparison(回答第一个问题)
用文字和表来描述;
表的设计一定要使其表示的内容更为清楚,一般是与其他方法的比较;
(用矩阵分解,一般用10次平均值或加减方差来标准自己的结果)
Parameter Settings(回答第二个问题)
一般会挑2、3个重要的参数来描述,且每个数据集的
λ
\lambda
λ 取多少需要用图来证明。
(图用python画)
Complexity (回答第三个问题)
由于讲解的论文时间复杂度与用户、物品个数呈线性关系,所以:
(图,还没画)
Discussion (回答第四个问题)
回答开头的几个问题(三个问题对应三句话)
实验代码部分
当需要多个数据集,多个方法及多个指标来实验时,最好用循环(Switch、case)来控制数据集、方法和指标。
3.9 Conclusion
- 结论一般不要太长, 5 句就够了. 如果想讨论的内部比较多, 应该在本节之前加入一个单独的 Disussions 小节;
- 避免使用与摘要内相同的句子. 摘要里面说我们做了哪些事情, 而这里应该说我们获得哪些观察与结论. 也就是说, 结论比摘要更加具体.;
- 如果要讨论说进一步工作, 可以列出 3 至 5 条, 不算在 Conclusion 的字数里面.。