学习了闵老师的论文写作课,我认为我学到最多的、印象最深刻的还是行文结构部分,因此专门对这一部分做下总结与感悟。
题目
- 长度:对于英文论文,其长度最好控制在40-60之间。越短代表着创新性越高,越长则是限定越多,适用范围窄,创新型就低。
- 尽量不使用based on:如果这样写,容易觉得这是一种对已有方法的一种拓展,并且这种题目已经泛滥了。
- 必须有吸引力:对于计算机方面论文而言, 应该写出自己提出的新问题或新方法.。新问题应该有意义而且有挑战性,新方法则应该高效或准确。
- 应当易于检索:流行的术语有助于被别人搜索到,也能帮助提高论文的被引频次。 对于一个学者而言,论文引用次数比论文数量更重要。
- 应当易于理解:术语和其它词汇应该在该领域内常用,不应该要求读者借助词典才能理解。
关键词:中肯不花哨;吸睛不俗套
摘要与关键词
摘要
把论文重要的内容摘录出来,包括三个部分:已有工作的评述、本文工作的描述和实验结果。
规范包括如下十句:
- 问题及重要性:说明问题所属的领域、或者解释最重要的概念,强调问题的重要性。(避免用important,因为过于笼统,建议用更加具体的词汇)
- 已有工作:描述已有的问题解决方案。
- 已有工作局限性:以however开头,应当尽量中肯客观的说明局限性(自己的工作应当解决该局限性),也可以不写。
- 本文工作:以in this paper开头,应当是题目的扩展,应当出现算法的缩写,也可以尽量多,超过20个单词(全文唯一可以超过20单词的句子)
- 本文方法的第 1 个技术/步骤/方面/优势/贡献
- 本文方法的第 2 个技术/步骤/方面/优势/贡献
- 本文方法的第 3 个技术/步骤/方面/优势/贡献(如果不能扯出 3 个方面, 论文的工作量就显得不够)
- 实验设置:给出数据的领域、来源、数量
- 实验结果:描述应当客观事实
- 展望:可以小吹,但还得客观
关键词
- 将关键词按照字母表排序
- 一般需要 3–5 个关键词
- 关键词一般由 1–3 个单词构成
引言部分
- 对整个故事进行详细描述,并且应当尽量吸睛,表现自己的研究工作的意义、理论完备、实验效果好等
- 八股结构:与摘要节奏相同,摘要的每一句都扩展成引言中的一段
- 每段应有 5–10 句. 这样, 该段就有 50-150 个单词.
- 开局一张图:“一幅图胜过千言万语”, 该图可以帮助读者花最少的时间理解论文的主要内容. 该图可以展现核心技术、算法框架、小的运行实例、效果对比等等.
- 可以尝试把自己单独的贡献列出来,放在实验陈述部分后,大概两三点就够了
文献综述
绝大多数的参考文献应该在论文中适当地引用,以展示对前人工作的尊重,并方便读者在需要时查阅。每篇论文都应包含文献综述,这样可以让读者更好地理解你工作的背景和位置。在进行文献综述时,需要对文献进行分类和介绍,以便读者能够理解你工作的意义和价值。避免将参考文献的引用作为句子的主语或宾语等,以避免混淆。以年份为主线的文献综述也不值得推荐,因为这会给人一种堆砌的感觉。同时,不要一次性引用过多的文献,也不建议全文引用,如果确实需要引用,应该在原句外面加上双引号,否则会被视为学术不端。此外,还应该对相关工作的优缺点进行合理的评价和讨论,优点是你选择该工作的原因,而缺点则是你论文工作的动机。
数学理论
这部分直接拿来举例子吧:
修改后的版本优点如下:
算法伪代码
算法伪代码是论文的核心之一
- 需要说明输入、输出;
- 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;
- 需要写出主要步骤的注释;
- 长度控制在 15-30 行;
- 可使用数学式子或对已有数学式子的引用;
- 不重要的步骤可以省略;
- 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准.
实验部分
实验部分才是重头戏
数据集
- 数据集越多, 覆盖领域越广, 结果就越可信. 在多数情况下, 12 至 20 个公开数据集就足够了.
- 数据集大些更好。从模型训练的角度来说,大数据量拟合成功等同于泛化能力强。
- 获取自己主要参考文献中的数据, 有利于进行比较
- 要么获得对比算法的源码, 要么实现它们.
自问自答模式
在实验之前提出一些问题,在实验结果列出之后逐个回答他们。
这种方式在实验之前提出问题,可以吸引审稿人兴趣,如果他们刚好对这部分感兴趣,那么就会读下去。偶尔有审稿人不喜欢这种风格, 觉得好像给小学生讲题. 万一他要提, 我们改就是了.
内部比较
自己使用多种算法进行比较
- 展示参数变化所导致的性能变化.二维图一次只能展示一个参数和一个性能指标.
- 展示主要方案与其变种相比的优势.
外部比较
自己的算法与其他已有算法进行比较
- 需要比较经典方案, 基准方案, 最先进的方案.
- 很多时候使用柱状图.(方便比较)
- 如果数据太多, 用表格就比图合适.
- 如果要把参数影响, 数据集大小影响也表现出来, 就只有用折线图.
- 最重要的比较放在最后.
- 要有足够的文字进行分析, 不能让读者自己去观察.
- 并不需要在所有数据集上击败其它方案.
- 在分析自己方案优势之余, 也应该分析它的劣势(客观中肯)
结论与展望
- 虎头豹尾. 结论一般不要太长, 5 句就够了. 如果想讨论的内容比较多, 应该在本节之前加入一个单独的 Discussions 小节.
- 避免使用与摘要内相同的句子.
- 如果要讨论说进一步工作, 可以列出 3 至 5 条
参考文献
bibitem模板
@ARTICLE{MinZhang2020Frequent,
author = {Fan Min and Zhi-Heng Zhang and Wen-Jie Zhai and Rong-Ping Shen},
title = {Frequent pattern discovery with tri-partition alphabets},
journal = {Information Sciences},
year = {2020},
volume = {507},
number = {1},
pages = {715--732},
doi = {10.1016/j.ins.2018.04.013}
}
@INPROCEEDINGS{MinCai2007Dynamic,
author = {Fan Min and Hong-Bin Cai and Qi-He Liu and Zhong-Jian Bai},
title = {Dynamic discretization: a combination approach},
booktitle = {ICMLC},
year = {2007},
pages = {3672--3677}
}
- 名在前, 姓在后. “Zhang Zheng” 不要写成 “Zheng Zhang”
- 千万不要直接使用网上的 bibitem。应当使用一个正确的模板 (例如上面给这个), 然后把文献的内容填进去, 这样可以避免多数问题.
- 格式把握好,具体表现在把等号对齐
- 为了保证格式的正确性, 应检查生成的 pdf 文件. 偶尔还会根据投稿期刊的要求来进行 bibitem 的修改.