闵帆老师的《论文写作》课程主要包括论文写作的概念、论文写作的各个部分、论文写作的技巧方法等,本文主要是对论文写作的各个部分的注意事项进行了总结,目的是记录论文写作中的整个过程中的各个部分,起到回顾和复习作用
1. 论文写作软件Latex
每种期刊都会提供一个或多个格式文件. Latex 源文件只需要进行少量改变, 就可以获得完全不同的版面.
不需要从头开始写,可以找已录用论文的源文件作为模板,获取找期刊提供的模板.
常见的 Latex 格式文件
- cls 文件
- bst文件
- 其它
2. 如何写英文论文
1. 单词或短语
禁用:And, Easy
慎用:Simple, Solve
视情况使用:Have’t 与 Don’t, Novel, Prove
其他
2. 解决英文句子的语法问题
借鉴法:找20篇订刊论文,找出简单局,总结并试着应用到自己的论文中
倒腾法:自己写一个英文句子,然后使用反复翻译,然后将非专业词汇转换成专业词汇
3. 题目
注意事项
必须有吸引力
必须易于理解
应该易于检索
长度最好控制在 40-60 个字母之间
尽量不使用 based on,使用 through, with 等来表示技术
如果主要贡献为算法, 题目的缩写就应该为算法的名称
可以通过订刊顶会的论文题目进行学习
4. 关键词
关键词常被看作摘要的一种补充
一般需要 3–5 个关键词,一个关键词一般由1-3个单词构造
将关键词按照字母表排序
5. 摘要
摘要10句
论文中的摘要是一段简洁的文字,旨在概括整篇论文的主要内容、方法、结果和结论。以下是老师的10句规范摘要:
- 问题及其重要性
- 已有工作
- 已有工作的局限性
- 本文工作
- 本文方法的第 1 个技术/步骤/方面/优势/贡献
- 本文方法的第 2 个技术/步骤/方面/优势/贡献
- 本文方法的第 3 个技术/步骤/方面/优势/贡献
- 实验设置
- 实验结果
- 提升
6. 引言
- 它应该对整个故事进行详细的描述
- 可以采用与摘要相同的节奏. 摘要的每一句, 都扩展成引言中的一段
- 每段应有 5–10 句
7. 文献综述
绝大多数的文献综述应在文献综述中引用
- 每篇论文都应有文献综述
- 可以在不同的地方描述
- 文献需要进行分门别类的介绍
- 参考文献的引用一般仅仅是一种附属品
- 不应将参考文献的引用作为句子的主语、宾语等
- 以年份为主线的综述也不值得提倡
- 不要一次性引用太多文献
- 不提倡全句引用
- 合理评述相关工作的优缺点
- 可以综述自己前期的工作, 但一般控制在 2-3 篇论文
- 参考文献必须在正文中引用
8. 符号系统、数学表达式、图片
8.1 符号系统和数学表达式
可以使用研究小组已经有的符号系统,不要对其中的符号进行额外的、特殊的处理
使用Latex进行数学表达式书写,不仅方便,而且高效
不同字体的同一个字母表示不同的涵义,需要检查符号系统
注意数学表达式在论文中的位置,当表达式过长时应进行切分,提高论文的可读性
可以找一篇已发布的论文的.tex文件进行数学表达式的学习
8.2 图片
尽量使用矢量图作图,选择合适的绘图软件很重要,不要使用Excel绘图
图注应该尽可能详细
引用图片时应保持符号一致
图片很重要,应该尽自己所能绘制出漂亮的图片,可以在这上面多花些精力和时间
9. 算法伪代码
算法伪代码是论文的核心之一.伪代码的目的是让读者能够理解算法的基本思想和流程,而不受特定编程语言的限制。在实际编写代码之前,程序员可以根据伪代码来设计算法的逻辑框架,并在选择特定编程语言时进行相应的转换和实现
写伪代码的注意事项:
- 需要说明输入、输出
- 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写
- 需要写出主要步骤的注释;
- 长度控制在 15-30 行;
- 可使用数学式子或对已有数学式子的引用;
- 不重要的步骤可以省略;
- 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准
老师提到的例子及tex源码:
\begin{algorithm}[!htb]
\renewcommand{\algorithmicrequire}{\textbf{Input:}}
\renewcommand{\algorithmicensure}{\textbf{Output:}}
\caption{Multi-label active learning through serial-parallel neural networks}
\label{algorithm: masp}
\begin{algorithmic}[1]
\REQUIRE
data matrix $\mathbf{X}$,
label matrix $\mathbf{Y}$ for query,
query budget $Q$,
cold-start query budget $P$,
number of representative instances $R$,
instance batch size $B_i$,
label batch size $B_l$
\ENSURE
queried instance-label pairs $\mathbf{Q}$, prediction network $\Theta$.
\STATE Initialize the serial-parallel prediction network;
\STATE $\mathbf{Q} = \emptyset$;\\
// Stage 1. Cold start.
\STATE Compute instance representativeness according to Eq. \eqref{equation: dp-representativeness};
\STATE Select the top-$R$ representative instances to reorganize the training set $\mathbf{X}$;
\STATE Update $\mathbf{Q}$ and $\mathbf{Y}'$ by querying $B_l$ labels for each of the top $\lfloor Q / B_l \rfloor$ representative instances;
\STATE Train the prediction network using $\mathbf{X}$ and $\mathbf{Y}'$;\\
// Stage 2. Main learning process.
\REPEAT
\STATE Compute $\hat{\mathbf{Y}}$ using the prediction network and Eq. \eqref{equation: label-prediction};
\STATE Compute label uncertainty according to Eq. \eqref{equation: label-uncertainty};
\STATE Query top-$B_i$ uncertain instance-label pairs to update $\mathbf{Q}$ and $\mathbf{Y}'$;
\STATE Update the prediction network using $\mathbf{X}$ and $\mathbf{Y}'$;\\
\UNTIL{($|\mathbf{Q}| \geq Q$)}
\end{algorithmic}
\end{algorithm}
10. 实验部分
许多机器学习论文,实验部分的篇幅很大,是一篇论文的核心部分之一.老师从实验的数据集信息、实验的进行模式(自问自答)、实验结果的内部比较和外部比较四个方面讲述了如何进行实验。并且也讲述了实验的效果不好时,可以考虑的几个解决方案。
10.1 数据集信息
数据集越多, 覆盖领域越广, 结果就越可信.
数据集大些更好. 如果是结构化数据, 有个样本和100个属性就比较好.
获取自己主要参考文献中的数据, 有利于进行比较.
要么获得对比算法的源码, 要么实现它们.
同一结果不应该在图和表中同时出现, 避免重复.
10.2 自问自答模式
实验的主要目的是回答一些作者和读者关心的问题. 因此, 我采用自问自答的方式, 在实验之前提出这些问题, 在实验结果列出之后逐个回答它们.
10.3 内部比较
内部比较可以展示参数变化所导致的性能变化,或者展示主要方案与其变种相比的优势.
10.4 外部比较
外部比较即与已有算法进行对比.往往需要比较经典方案,基准方案,最先进的方案;如果数据量太大,建议做成表格;最重要的比较放在后面;详尽的文字分析来阐述变化;在分析自己方案优势之余, 也应该分析它的劣势。
10.5 实验效果不好的解决方案
- 设计替换方案 (alternative approach)
- 观察算法所适用数据的特点
- 使用各种评价指标. 有可能某些算法在某些指标上表现更好
- 调参
- 输出中间结果,想办法改进中间结果
- 提升自己的洞察力 (insight)
11. 结论
结论作为论文正文的最后一部分,读者和审稿人都会逐句阅读.一下是写结论的一些注意事项:
- 结论一般不要太长
- 避免使用与摘要内相同的句子
- 如果要讨论说进一步工作, 可以列出 3 至 5 条, 不算在 Conclusion 的字数里面
12. 参考文献
参考文献示例:
@ARTICLE{MinZhang2020Frequent,
author = {Fan Min and Zhi-Heng Zhang and Wen-Jie Zhai and Rong-Ping Shen},
title = {Frequent pattern discovery with tri-partition alphabets},
journal = {Information Sciences},
year = {2020},
volume = {507},
number = {1},
pages = {715--732},
doi = {10.1016/j.ins.2018.04.013}
}
@INPROCEEDINGS{MinCai2007Dynamic,
author = {Fan Min and Hong-Bin Cai and Qi-He Liu and Zhong-Jian Bai},
title = {Dynamic discretization: a combination approach},
booktitle = {ICMLC},
year = {2007},
pages = {3672--3677}
}
注意事项:
- 不要直接使用网上的 bibitem
- 将等号进行列对齐
- 名字要有意义,并且名在前, 姓在后
- 注意题目的大小写, 可以用花括号强制设置
- 期刊的名字按照正常方式写即可
- 会议名如果使用简称, 就不要再写全称
- 由于有 year 域, 不要在会议后面再加年份
- 页码之间应使用两个连词符 -, 最终的效果就是一条比较长的横线
- 特殊字符需要使用转义符才能正常显示
- 不要把特殊字符 (包括全角的引号, 头上戴点的字母等等) 拷贝进 bib 文件
- 除最后一行外, 其它行应以逗号结束
- 为了保证格式的正确性, 应检查生成的 pdf 文件