如何写好一篇论文——闵帆老师《论文写作》课程总结

 今天我将为大家分享一门近期学习的研究生课程《论文写作》主要学到的知识要点的汇总。在这个课程中,我学到了很多关于计算机类论文(这里主要是机器学习)写作的技巧和方法。希望通过我的分享,能够为正在撰写小论文的朋友们提供一些帮助和启示。

本篇总结基于闵帆老师的《论文写作》专栏,链接如下:论文写作_闵帆的博客-CSDN博客


01学术论文的4W1h(基本概念)

what(学术论文是什么)

  • 对研究工作的阶段性总结:论文内容不需太多, 创新点1~2足矣
  • 科研八股文:每个部分内容有固有要求(方便读者找到自己需要的内容),不需要文采
  • 结构清晰的表格

why(为什么写学术论文) 

  • 达到毕业条件
  • 知识传承与学术宣传

when(什么时候写学术论文 )

  • 越早越好
  • 最迟研一下学期
  • 做实验前后

where(在哪里写学术论文 )

everywhere

how(如何写学术论文 ) 

  • 读文献, 总结模板, 在自己总结的模板上写
  • 使用别人总结的模板写

 02 这些单词与短语,慎用!!!

一般而言, 未出现在任何学术论文中的单词, 不可以使用。

Have’t        Don’t

正式的论文中,这种简写是不正确的.应使用 have not, do not, can not 之类.

And

句中慎用 and, 除非有对仗工整的词组, 如: data mining and machine learning.

Easy        Simple

禁用. 一个东西简单大家还干嘛研究.
如果想说 simple yet effective,可以偶尔使用.

Solve

慎用. 只有彻底解决某个数学难题, 写出了相应的定理与证明, 才能说 solve. 做机器学习, 一般无法解决某个问题, 所以应该写 handle 或 address.

Novel

novel 比较夸张, 表示比较大的创新,慎用(可以换成new). 也有人指出, 如果投顶刊顶会都不敢用 novel 的话, 审稿人也会小瞧你. 还是根据自己工作的创新性来选择.

Only

把 only 放到一个尽可能靠后的位置. 如: 使用 consider only uniform distribution 而不是 only consider uniform distribution. 前者表示你仅考虑了均匀分布, 对其它分布只是暂时没做而已. 而后者表示你太菜了.

Prove

实验结果只能表明 (show) 而不能证明 (prove) 某个规律.


 03别犯低级错误

大小写

容易大小写出错的是参考文献作者的姓名(应该是首字母大写).
也要注意 a 与 an 

空格

主要包括如下几种情况:

  1. 标点符号后面缺少空格
  2. 标点符号前面多了空格
  3. 小括号前少了空格
  4. 参考文献引用的方括号前少了空格
  5. 连续几篇文献的引用之间多了空格

全角符号

英文论文中不应该出现全角符号, 除非你真的需要在论文中出现中文. 最容易出问题的符号有两个:

  1. 横线:全角符号是−, 半角符号是 -. 
  2. 引号:全角符号是‘, 半角符号是 '.

数学符号

符号应规范, 且保持同一篇论文中的一致性.

如果论文涉及不少数学符号, 应该给出一个符号表, 便于读者查阅.例如:

数学式子涉及的标点符号

数学表达式是句子的一部分, 所以也需要符号.

  1. 如果一个数学表达式是一个句子的结束, 应在末尾打个句点
  2. 如果一个数学表达式还没把话说完, 应根据后面的情况选择相应的符号(比如逗号或分号)

 句子

学术论文的主要功能是进行读者与作者之间的交流, 句子太长影响阅读.

病句:如缺少主语,基本语法不正确的句子,单复数使用错误的句子,同一词组在同一句子中重复出现.

如何解决英文句子的语法问题?

四个字:总结句式!!!两个基本方法如下:

借鉴:

  1. 找 20 篇顶刊的论文.中各个部分的简单句子, 如: The main idea is to estimate the total energy consumption by summing the energy contributions of each instruction.
  2. 获得句型, 如: The main idea is to … by …
  3. 在自己的论文中使用.
  4. 注意事项:按句子出现的位置 (摘要、实验) 来分别总结, 它们有不同的时态和味道.复杂的句式 (带多个从句) 不要学. 

反复机器翻译: 

  1. 基本步骤:写一个表达自己意思的英文句子.
  2. 使用google翻译成中文句子.
  3. 再翻译成英文句子……直到中文句子和英文句子都不再改变 (即收敛).
  4. 将句子中的非专业词汇换成正确的专业词汇. 这是因为翻译软件对它们不了解.

宽度

  1. 单栏排版,所有表格应等宽, 且与文字边距一致. 
  2. 双栏排版应与当前文字边距一致.
  3. 数学表达式宽度不应超出文字宽度. 这里既包括编号的数学表达式的, 也包括在文字中间未编号的表达式.

图片

  1. 未使用矢量图视为错误. 放大后看起来会很模糊.
  2. 未按标准画的流程图视为错误. 

下面,就从论文的题目开始,将论文的各组成成分一一讲解!!!全是干货!!! 

 04给自己的宝贝起个名字

 题目对于论文来说至关重要. 如果说论文是孩子, 那么题目就是他的名字.

  • 必须有吸引力

不炫的论文题目审稿人看了没兴趣.对于计算机方面论文而言, 应该写出自己提出的新问题或新方法. 新问题应该有意义而且有挑战性, 新方法则应该高效或准确.

  • 必须易于理解

术语和其它词汇应该在该领域内常用, 不应该要求读者借助词典才能理解.

  • 应该易于检索

流行的术语有助于被别人搜索到, 也能帮助提高论文的被引频次. 对于一个学者而言, 论文引用次数比论文数量更重要.长度最好控制在 40-60 个字母之间.使用 through, with 等来表示技术.如果主要贡献为算法, 题目的缩写就应该为算法的名称

 05摘要——抽出论文的重要内容

通常包括三个部分: 已有工作的评述, 本文工作的描述,实验结果. 

  1.  问题及其重要性
  2. 已有工作
  3. 已有工作局限性
  4. 本文工作
  5. ……本文方法的第 n个技术/步骤/方面/优势/贡献(如果不能扯出 3 个方面, 论文的工作量就显得不够).
  6. 实验设置
  7. 实验结果
  8. 提升

06关键词——快速检索论文 

关键词常被看作摘要的一种补充,一般需要 3–5 个,每个关键词一般由 1–3 个单词构成.
将关键词按照字母表排序,例如:

Distinguishability, ensemble learning, mapping, multi-instance learning, self-reinforcement

07引言——开始讲故事 

在计算机英文论文中, Introduction 需要讲述完整的故事. 近年来, 一些好的中文杂志也逐渐采用了这个风格.

很多审稿人在读完引言后, 就有了基本 (80% 以上) 的判断.

如果引言写得漂亮, 他就会在后面的正文中找出一些证据, 赞扬研究工作有意义, 理论完备, 实验效果好等等.

如果引言写得难看, 感觉作者没受过专业的科研训练, 他也会在正文中找出几条问题, 说论文写得不好.

读者也通常会在阅读完引言后决定是否引用该论文.

因此, 如果你把自己的重要内容藏着掖着, 不在引言中展现出来, 就没人会去花时间发现它们.

那怎么写引言呢?

  • 采用与摘要相同的节奏.

摘要的每一句, 都扩展成引言中的一段
有些期刊和会议还喜欢让作者把自己的贡献单独列出来, 放在实验陈述段落之后,这个与论文的 Highlights 是同一个意思. 
引言的最后一段以 The rest of the paper is organized as follows. 开头即可. 不需要玩什么花样.

 08理论部分——数学请再爱我一次!!!

一般性的准则如下:

  • 理论应该完备
  • 符号要保持同一风格
  • 重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary, 附属于算法的叫 property.

这里用一个例子来说明如何写定义:

09伪代码该怎么写?? 

  • 需要说明输入、输出;
  • 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;
  • 需要写出主要步骤的注释;
  • 长度控制在 15-30 行;
  • 可使用数学式子或对已有数学式子的引用;
  • 不重要的步骤可以省略;
  • 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准.

下面是我之前读过的一篇文章里面的deepwalk算法的伪代码,供大家参考:

 10实验——机器学习论文的重头戏

 看了很多机器学习的论文, 发现实验部分会占据论文的大半篇幅.要注意下面几点:

数据集信息:

  • 数据集越多, 覆盖领域越广, 结果就越可信. 
  • 在多数情况下, 12 至 20 个公开数据集就足够了. 
  • 数据集大些更好. 
  • 获取自己主要参考文献中的数据, 有利于进行比较. 

实验的主要目的是回答作者和读者关心的问题. 因此, 采用自问自答的方式, 在实验之前提出这些问题, 在实验结果列出之后逐个回答它们. 

内部比较:

  • 展示参数变化所导致的性能变化.
  • 二维图一次只能展示一个参数和一个性能指标. 因此, 如果有很多参数, 就只能讨论最重要的几个, 否则图太多.
  • 展示主要方案与其变种相比的优势.
  • 有时候有好几种可选方案, 通过比较, 可以获得最佳那个. 

外部比较:

  • 外部比较即与已有算法进行对比.
  • 需要比较经典方案, 基准方案, 最先进的方案.
  • 很多时候使用柱状图.
  • 如果数据太多, 用表格就比图合适.
  • 如果要把参数影响, 数据集大小影响也表现出来, 就只有用折线图.
  • 最重要的比较放在最后.
  • 要有足够的文字进行分析, 不能让读者自己去观察.
  • 并不需要在所有数据集上击败其它方案.
  • 在分析自己方案优势之余, 也应该分析它的劣势. 因为机器学习的基本规律就是 No free lunch, 即一个方案既然有优点, 就肯定有缺点. 既然有擅长的数据/指标, 也就有不擅长的数据/指标.
     

 11结论——别太唠叨

通常审稿人和读者都会逐句阅读本部分.

结论一般不要太长, 5 句就够了. 如果想讨论的内容比较多, 应该在本节之前加入一个单独的 Discussions 小节.
避免使用与摘要内相同的句子. 摘要里面说我们做了哪些事情, 而这里应该说我们获得哪些观察与结论. 也就是说, 结论比摘要更加具体. 可以具体到论文中的某个算法, 某条性质, 某个定理, 某个实验结果, 这样就自然与摘要区别开来.
如果要讨论说进一步工作, 可以列出 3 至 5 条, 不算在 Conclusion 的字数里面. 


12参考文献——别小看,这里很可能会出格式错误!! 

Latex 提供了 bib 文件进行参考文献的管理, 极大地减轻了作者的负担. 


以上是我对论文写作课程的一些感悟和总结。我相信,通过不断的学习和实践,我们一定能够提高自己的论文写作能力,为学术研究做出更大的贡献。感谢大家的阅读和支持!

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值