文章目录
本篇文章是对《 论文写作》这门课程的总结,闵老师以幽默风趣的授课风格为我们讲解如何写好一篇科技论文。通过课程学习,我对论文写作有了进一步的理解和体会。一是对科技论文的整体框架有了新的认识和把握。二是学到了论文中每个部分的书写格式和书写经验。
1 How to write a paper
1、研究与写作
首先论文是“做”出来的而不是“写”出来的,论文需要有在好的研究工作的支撑
“做”:Topic -> Problem -> Idea -> Concrete work (theoretical analysis, experiments, etc.)
找到好的问题,产生好的idea是非常重要的
“写”:Paper writing -> Submit
2.写论文之前
论文署名:
- 第一作者执笔
- 通讯作者是整个研究工作的负责人
- 按贡献大小排序,小的贡献可以放在致谢里
发表源:
-
寻求导师、师兄师姐的帮助,确定合适的发表源
-
发表源类型:Journal、Conference、Magazine(计算机届很重的会议论文的,周围的师兄师姐们也都在冲会议!)
-
注意同一论文不能在期刊上发表两次,但会议文章篇幅较短可以扩充后可以再投期刊
-
期刊的发表周期通常很长
-
绝对不要一稿多投
稿件处理流程:
- Journal 主编->副主编->审稿人->审稿意见->处理意见->审定
- Conference 投标->处理->答复
审稿方面:Relevance、Originality、Significance、Soundness、Presentation
3.清晰的论文结构
Title->Abstract->Introduction->Previous works->Your contribution->Support (theoretical or experimental)->Discussion->Conclusion->Reference
下面将对以上各个部分进一步学习。
2 Writing details
Words and terms
1)不要使用“Novel”(突破性的工作),可以使用“new“;
2)不要使用“Have’t”和“don’t”(不正式),可以使用“have not”和“do not”;
3)不要在开头使用“And”,and用来连接相同状态的部分;
4)使用 “consider only” 而不是 “only consider”;
5)使用 “address the issue”而不是 “solve the problem.”;
6)查阅链接了解一个术语的更多流行用法。
Notations and equations
1)应避免对方程进行控制;
2)变量,常量和操作符是斜体;
3)集合、数组和向量应该加粗;
4)当文本中的数学表达式太长时,应将其拆分为多个表达式,避免超出右边界;
5)等式是句子的一部分,所以它后面应该有一个逗号、分号或句号。
Sentences
1)在LaTeX中每句话换行。如果行尾有注释,%之前应该插入一个空白
2)句号,逗号,分号前不能有空格;
3)相邻句子间用逗号隔开;
4)在引用前后应该有空格;
5)相邻引用之间不应有空格;
6)每句话不应超过15个单词。除“In this paper”开头的句子;
7)一个句子里只能用一个动词;
8) 在同一个句子或两个相邻的句子中,应该避免重复的词;
9)同样的意思不应该重复;
10)采用简单的主语-谓语-宾语结构;
11)句型。从现有论文中获取句型(自己总结);使用谷歌递归翻译。
3 Title
毋庸置疑,论文的标题是非常重要的,当读者从大量论文中选择出他们感兴趣的论文,title就是一个敲门砖。一篇好的论文,需要一个能够吸引读者的题目,题目也是判定论文质量的一部分,关于title,有以下几点需要着重说明:
1)字数
题名不应过长。长度控制在40到60个字符之间,对于我们这种新手来说,所写的title很容易会超过这种限制,要学会压缩,使用较短的词语来替换较长的词。总的原则是,题名应确切、简练、醒目,在能准确反映论文特定内容的前提下,题名词数越少越好。善用google翻译。
2)准确性
精准的使用名词与形容词来表达一个新问题或一个新方法,做到通俗易懂;尽量使用“through”和“with“来连接技术名词,避免使用“based on”。
3)大小写
题名字母的大小写有以下3种格式:全部字母大写;每个词的首字母大写,但3个或4个字母以下的冠词、连词、介词全部小写;题名第1个词的首字母大写,其余字母均小写。
4)缩写
已得到整个科技界或本行业科技人员公认的缩略词语,才可用于题名中,否则不要轻易使用。若主要论述一种新算法,则标题可以为该算法的首字母缩写。
4 Abstrcat
摘要是全文的精华所在,是对整篇文章内容的精炼,是对内容的客观简短的陈述,它通常包括三个部分:现有的工作,论文的工作,和实验结果。
在写作中,通常使用十个句子组成一段摘要,以下为这10个句子的具体体现:
1)研究问题及其重要性。
这个句子可以识别问题的领域,解释主要概念,或问题的重要性
In many data mining and machine learning applications, there are two objectives in thetask of classification: one is decreasing the test cost, the other is improving the classificationaccuracy.
2)现有工作。
这个句子可以描述解决这个问题的最先进的方法
Most existing research work focuses on the latter, with attribute reduction serving as anoptional pre-processing stage to remove redundant attributes.
3)现有工作的限制(optional)。
这个句子以“However”开头。但是不能不太过于强烈的抨击别人的工作。
4)本文的主要内容。
理想情况下,它应该是标题的延伸。该算法的缩写也应该出现在这句话中。只有这个句子可以超过20个单词。
In this paper, we point out that when tests must be undertaken in parallel, attribute reductionis mandatory in dealing with the former objective.
5)算法的第一个方面/技术/阶段。
With this in mind, we posit the minimal test cost reduct problem which constitutes a new,but more general, difficulty than the classical reduct problem.
6)算法的第二个方面/技术/阶段。
We also define three metrics to evaluate the performance of reduction algorithms from astatistical viewpoint.
7)算法的第三方面/技术/阶段。
A framework for a heuristic algorithm is proposed to deal with the new problem; specifically, an information gain-based -weighted reduction algorithm is designed, where weights are decided by test costs and a non-positive exponent which is the only parameter set by the user.
8)实验设置。
它应该声明数据集的域/数量/来源
The algorithm is tested with three representative test cost distributions on four UCI (University of California-Irvine) data sets.
9)结果。
它应该说明精度的提高,运行时间的减少等内容。Experimental results show that there is a trade-off while setting, and a competition approach can improve the quality of the result significantly.
10)从更高层次的角度进行贡献(optional)。
本论文可能为这一研究领域打开一扇新的大门
This study suggests potential application areas and newresearch trends concerning attributereduction.
其他注意点:
1)当15个单词描述不清楚一句话时,可以将其拆成两句话。
2)摘要和引言容易重复。
3)时态都使用现在时。
5 Keyword
一篇论文中的关键词,往往通过短小的词语,对这篇文章的描述重点及核心内容进行精准定位.
1)关键词个数
关键词选择一般来说需要3~5个,每个关键词不宜过长,除非是现有的专业术语本身就比较长。
2)关键词排序
可以按照字母表的升序进行排版。
6 Introduction
引言尽管不像摘要那样有一定的篇幅限制和相对固定的格式,但在内容和结构模式上也有需要遵循的规律。它描述了整个文章的充足的细节内容。
1)从文章的整体结构来看的话,Introduction提出了论文的研究问题,那么该问题的答案通常是在论文的Conclusion部分,或者实验部分,自然这便形成了一种首尾呼应的结构。
2)阐述研究背景和重要性,引出该领域科研的空白。
3)告诉读者这篇论文为何去探究某个问题,这个问题存在哪些挑战与在这个问题领域已有的成果,阐述该论文是从哪个角度出发来产生思路的。
4)相当于要去指出研究现状中未解决的问题,然后引出本篇论文要是用什么方法去解决某个问题。
7 Related Work
Related Work是介绍目前对于研究的这个问题的已经产生了的成果。这里有很重要的一点就是引用他人的工作要注意添加参考文献。在写Related Work 的时候要合理分配内容的简略,哪个地方应该详细阐述,哪个地方应该简略,把握这个度。灵感其实可以去阅读一些好的综述类论文,因为综述论文里面的工作有大量的内容都是在陈述已有的工作。Introduction与 Related Work的区别是:前者是在指出研究的这个问题的已有成果的不足与空白,后者是在介绍别人用的方法,介绍研究现状。
8 The theoretical part
理论部分中很重要的是符号系统的定义,并且上下文的各符号应该保持一致,以下对一些常用的符号进行示例:
1)标量等:数据集大小
n
n
n、实例维度
d
d
d、数据集类别数量
c
c
c、第
i
i
i个实例的标签
y
i
y_i
yi,
2)向量等:第
i
i
i个实例
x
i
x_i
xi;,对于多示例这样的特殊结构,使用
x
i
j
x_{ij}
xij表示第
i
i
i个包中的第
j
j
j个实例;
3)矩阵等:在多示例中
X
i
X_i
Xi表示数据集中的第i个包;
4)多个包构成一个数据集
B
\mathcal B
B;
5)其他:
X
\mathcal{X}
X表示实例空间。
9 Algorithm
这一部分的重点是伪代码的书写,当然在Abstract和Introduction中已经对自己论文中的步骤进行了简要的描述,这里需要将其转换为数学表达式为主,少量文字说明为辅的方式。以下通过算法1进行简要说明。
1)输入输出要与预先定义的符号说明相互呼应;
2)类似于代码中的赋值,c==2不应该写成c =2;
3)使用到的符号一定要进行特殊说明,例如
d
c
=
r
×
max
d
d_c = r \times \max{d}
dc=r×maxd,where
B
i
\mathbf B_i
Bi,
B
j
∈
B
\mathbf B_j \in \mathcal{B}
Bj∈B,这里便指明用于计算距离的两个包是属于同一个数据集
B
\mathcal{B}
B的;
10 Experiments
实验部分是一篇论文的有力后盾,用来证明这篇论文的真实性与可靠性,其中能用图片表格的地方,尽量不用文字。实验中,可以首先提出问题并说明自己的实验环境。必须说明自己对比的算法有哪些,使用的数据集如何,实验的类型是什么。对于一个具体类别的数据集,需要说明一些基本信息,比如数据集大小、标签类别、实例个数等等,详尽最好。对于实验部分主要包括以下注意点:
1)数据集的选择与解释说明,例如数据集数量、数据集大小
2)比较算法、现有算法
3)实验的结果
4)图片、表格让论文内容更加丰富与直观,论文中的图片必须是矢量图,常用的矢量图格式为Svg pdf emf eps。如下图:
11 Conclusion and further work
在一篇论文中,最能吸引读者的除了标题和摘要,其次就是总结部分。通过总结,读者可以更快的了解到这篇文章所做的工作及对该领域的新贡献。除此之外,还可以总结自己这次论文工作的不足之处,写出自己基于该问题领域在未来的工作走向。
总结通常包含五个句子。在描述中尽量不要使用和摘要重复的句子,应该比摘要的描述更加具体,可以包含一些实验结果;同时应该描述下一阶段的工作,这也会为其他作者提供引用的素材。
12 References
在书写这部分内容时,我们最主要是要编写好bib文件。我们的LaTex通过bib里的内容,产生格式统一的参考文献。课堂中主要提到的文献类型包括article、 inproceedings、book、 misc和 phdthesiso等。以下图bib文件为例,我们需要获取如图所示的包括标题、作者在内的一系列文献相关信息。其中,“article”是文献的类型;“Xiang2016Key”是一个自定义的对该文献的标识,用于在代码中引用:另外的部分就是与文献相关的具体内容,包括标题、作者等信息。
写完了写完了,非常感谢闵老师的授课指导,让我受益匪浅。祝愿看到此贴的大家都疯狂出论文!