课程笔记之《论文写作》

前几天听见了实验室的师兄发表了一篇 T r a n s Trans Trans ,哇,那叫一个劲的羡慕啊,光羡慕不管用啊,得实干才行呀。
在这里插入图片描述
目前研一,尚未开启paper maker 之路,大多数人小白的论文估计跟我一样:
在这里插入图片描述

不过俗话说,搞计算机的,都卷一点,不寒碜。因此,论文虽还没有写,但东西(笔记)得先准好,磨刀不误砍柴工嘛。此帖是关于老板讲的论文写作( 老板博客)这门课进行笔记梳理,一来是给大家做一个分享,二是在自己写论文的时候就可以回来重温一下笔记,尽量避免踩坑哇。

如本贴有遗漏或者表述不准确的地方还请多多批评。


那么下面俺就开始了:

在这里插入图片描述
直奔主题,一篇计算机论文大致包含了以下几个部分:

写在前面:科研论文啊,一定要是简单句,别整一些花里胡哨的从句什么的。即使英语水平很高也别皮,因为越复杂越容易出语法上的错误,这种错误会给审稿人留下非常不好的印象,况且大家都是理工科,很多人的英语水平懂得都懂。包括人家老外都不作,写的论文都是能写简单句就写简单句。能用15个单词说清楚的事,绝不用30个单词,所以一句话来说就是“一切从简”。

在这里插入图片描述

Title(标题)

标题是一篇论文的首要,一个好的标题应该有以下特点:

  1. 首先标题得取得有足够的吸引力,这样才能激起读者往下读的兴趣。标题可以是:提出一个新问题或者关于 … 的新方法。注:这里的 “new” 指的问题一定是得有足够挑战性的,方法能比当前工人的高效之类的,或者重大发现的才能使用。如果是仅在前人的工作上进行简单改进的话,或者组合的话就不适合用 “new” 来命名标题。
  2. 标题应该是 易懂 的 ,不存在歧义的,大家拿到论文一看题目就能明白这篇论文是做了什么样的工作。
  3. 取的标题能够容易被检索到 ,因为论文的题目越容易被搜到就意味着你的成果能够被更多的人看到,那么被引用的概率就会更大。
  4. 因为是写英文论文,所以标题的长度一般是 40~60 个字符比较好。标题太短可能无法把一些专有名词表述清楚;而有些明明用短的标题就能说清楚的,如果故意拖得太长的话,可能会让读者觉得没有新颖甚至可能会显得不专业。
  5. 标题取名时尽量避免使用“基于(based on)”,而是使用“通过(through or with)”,因为按照前者取名可能会让读者误以为该论文是对前人的一个简单扩展或者应用,这样会导致自己的创新点(或者自己的工作)被埋没或者不明显。
  6. 如果该论文主要是贡献(或者工作)是你实现的新算法,那么该算法(的缩写)可以纳入(作为)标题

Abstract (摘要)

摘要是一篇论文对的核心阐述,其中包括了研究的核心问题是什么,自己做了什么工作。摘要通常用大约十个句子来描述三个部分:对于该问题已有的工作、本论文的工作、以及实验结果。以下是摘要的内容结构:

  1. 首先得抬出你研究的问题,并且对该问题做简单的解释以及该问题重要性(价值)。因为通过该问题,读者可以一目了然本篇论文大致的研究工作或者研究方向。
  2. 我们得对该问题(或者说课题)前人最新的工作进行一个简单的提要。因为我们目前大多数都是站在巨人的肩膀上进一步研究,很少有从零得到新的研究领域。我认为提及前人工作一是对前人工作表示尊敬,二是能够让同一类研究的问题能更好形成一个体系,是一步步向前更新的过程。
  3. 既然提到了前人的工作,就需要“抛玉引砖”了,我们得简单的陈述一下前人工作的局限性切忌过分批判),这样才能引出你的研究嘛,不然前人都做得很完美了,还需要后续的研究做什么呀。
  4. 这句是说本 paper 的主要内容,它应该是围绕你的题目的一个小小展开,并且建议缩写的算法也出现在该句话中。因此,只有这句话可以超过20个单词。
  5. 这三句就描述一下自己算法,一般是分三个技术点(technique)或者测重方面(aspect)或者阶段(stage)来说。(first)
  6. 这三句就描述一下自己算法,一般是分三个技术点(technique)或者测重方面(aspect)或者阶段(stage)来说。(second)
  7. 这三句就描述一下自己算法,一般是分三个技术点(technique)或者测重方面(aspect)或者阶段(stage)来说。(third)
  8. 简单的提了一下核心算法后接下来就该说说具体的实验是如何设置参数的或者域名及数据集来源,因为提供了这些资料,读者才能更好复现你的项目,读者才会更愿意引用。
  9. 然后就是对实验结果进行阐述,其中包含的指标有:时间复杂度、准确率、代价等等,有了这些指标读者才能更加直观的了解你的算法是否优秀。
  10. 最后在一个更高层次的角度来谈谈本次的贡献(选说),也类似一个对后续工作的简单展望,因为每发表一篇论文都是为一个新的领域(或者为某个方向提供思路)打开一扇新的大门的,而不是关闭一扇大门。

Keyword(关键字)

关键字一般是写在摘要的下边,因此通常认为关键字是对摘要的一个补充。一来是方便对本篇论文的检索,二来关键字的选择可以更好的帮助论文在该论域的一个定位。以下有3个需统注意的点:

  1. 关键字不宜太多或太少,3~5 个比较合适。一个关键字不宜太长,除非是已知的专业术语。
  2. 关键字不能随随便便就扔几个在那里,我们应该按照字母表升序排列。老板上课说过,审稿人一天看那么多论文,看到你的时候,关键字还乱七八糟的不按顺序,他就看着不舒服,一不舒服就会不高兴,一不高兴就会把你给拒了。所以,不注意细节的话有时候不然怎么凉的都不知道。
    在这里插入图片描述
  3. 有时候一些格式的话投不同的期刊要求是不一样的。有些期刊支持两种类型的关键词,一种是索引词表示的是研究领域,是由提交系统时进行选择的,就像csdn每次发表一篇帖子的时候他会叫你自动选一个分类;第二种是作者根据自己的论文提出的。

Introduction(引言)

所谓引言就是用最朴素的英语句子等自然语言(数学表达式之类等等)来描绘你的整个故事。并且,通过引言能让审稿人和读者明白你这篇论文的价值之处。

  1. 这个故事需要描绘足够细腻,因为读者通常是在阅读完引言之后再决定是否引用。故事中包括了你的数学式子、算法、实验结果等。如果故事描绘的引人入胜,审稿人会找个理由接收;如果不够生动完整可能使你论文中的其他闪光点被埋没,甚至最坏的情况会因拼写错误而招致拒稿之祸。
  2. 引言可以遵循摘要的节奏来描述你的故事,比如将摘要的每个句子展开到引言的每一段来说。值得注意的是:每一段的第一句通常是一个声明或主题,然后该段剩余部分是对这个声明的证明解释和阐述。
  3. 提到了段落自然有段落的要求。每一段5 ~ 10个句子比较合适,然后一段就大约 50 ~ 150 个单词
  4. 还一种写引言很流行的方式,就是“开局一张图”,直接就先摆出自己算法核心图或者运行示例。这种方式可以让读者快速的了解到该论文的主要思想,以及算法的优势也能清晰的展示出来。
  5. 引言的最后一段一般是说该论文的组织结构,但根据会议论文和期刊的格式要求不同,具体问题具体分析。

Related work(相关工作)

又到了“紧张刺激”的相关工作环节了,介绍相关工作既是对前人工作的总结,也是对自己所研究问题的背景介绍。

  1. 在介绍相关工作的时候,不能只是把参考了哪些文献或者什么算法就一箩筐的摆出来,这样会让审稿人觉得作者没有领悟到参考文献的价值。因此,在提及相关工作的时候应该分类说明,这样也能更好的显示出你所做工作是在哪个地方(position)。
  2. 在写前人工作的时候,如果出现了某个句子没有引用情况,也应该保证其是它一个完整的句子。一般以引文打头的句子不是很好我认为这样可能会让人觉得作者缺乏原创性或者略失创新性的赶脚(个人观点)。如果有一句话你觉得原文说的非常完美,没法改动了,并且非要引用这整句话不可,那么就在写的时候加上双引号吧,不然别人就会说你是抄袭。
  3. 在引用时,不是无限制的引用,引用越多就说明越好。在一处的引用数量也是有要求的,一般在一处最多引用3篇文章即可。那如果3篇实在不够怎么办,在其他地方继续引用就是撒。
  4. 在描述前人工作的时候除了强调各个参考文献的优势或者说重要性时,肯定也得讨论前人工作的一些局限性,这样才能引出自己的工作。但说局限性的性时候需委婉,用一些温和的词语,切勿过分批判否定,毕竟大佬始终是你大佬啊,始终记住我们都是站在巨人的肩膀上的。最刺激情况就是,你在对前人工作一顿稀里哗啦的批判后,然后审稿人就静静看着你的这篇论文,因为他很有可能就是这篇文献的作者,那你这不又凉了吗。
    在这里插入图片描述

Theoretical (理论部分)

我个人觉得不只是对于计算机的学生来说很难,对于非数学专业的学生来讲都比较痛苦。

  1. 要攻破一个理论都是从内部出发的,而不是从外部。因此,理论首先得保证自身的完备性
  2. 在写理论的时候不免一些定义和数学式子,符号的一致性尤为重要,这不仅保证前后的逻辑一致,也体现一个人作风的严谨。

一些数学式子,如信息熵: G a i n ( D , a ) = E n t ( D ) − ∑ v = 1 V ∣ D v ∣ ∣ D ∣ E n t ( D v ) \mathbf{Gain}(D,a)=\mathbf{Ent}(D)-\sum_{v=1}^V\frac{\vert D^v \vert}{\vert D\vert}\mathbf{Ent}(D^v) Gain(D,a)=Ent(D)v=1VDDvEnt(Dv)

题外话: 有些人看着那么多的复杂的数学符号和式子就头疼,更别说写了,这里说一下训练技巧:数学式子那么多,我觉得只有多去熟悉它才能减少对它的恐惧,就像代码一样,多敲。不是有一句话是这样说的吗:“我亦无他,惟手熟尔”。因此,多练就行了,推荐练数学式子较好的方式,多写 CSDN,因为听说 MARKDOWN 跟 LATEX 的数学式子写法是一样的,虽然最初也是被老板逼的,不过现在渐渐喜欢上了码帖子,特别是,左边一大片代码而右边呈现出整洁美观的数学式子的时候,辣是真滴上头呀。这里帮老板打个广告:你还在为数学表达式而恐惧吗?你的数学表式子还在通过复制吗?那就来数学表达式魔训吧:https://blog.csdn.net/minfanphd/category_11236630.html?spm=1001.2014.3001.5482

Algorithm (算法)

算法通常是指所提方法的核心,一般是伪代码。

Adboost伪代码,如:
在这里插入图片描述
这是写伪代码的一些要求:

  1. 开头应标明输入和输出
  2. 并且每一步应该标序号和主要步骤的注释,尽量一行就是一步
  3. 方法的名称是可选的
  4. 一个算法的伪代码应该控制在一页的样子,在 15 ~ 30 行比较合适,除了一些已有广为大家熟知的算法(如,上图的Adboost算法)。写的时候可以多用数学表达式和代码语言相结合,能让人明白为最终目的。并且通过数学式子可以减少大量语言描述,更加的清晰明了。
  5. 一篇论文最多三个算法就足够了,一个主程序和两个子程序的,一些没有必要程序的算法就不用贴上去了。
  6. 大多数时候都需要算法的时间复杂度分析和空间复杂度分析。即使你没有做,在提交到审稿人那里他会叫你补上的。所以,与其让审稿人说,还不如主动出击,自己先加上。

Experiment (实验)

对于机器学习的论文,实验部分一般占了一半以上的篇幅。
7. 在大多数情况下12到20个数据集就足够了,而对于像微生物致病这种比较缺乏的小样本数据集一般是通过数据扩增的方式缓解这一困难。
8. 一般选择数据集尽量选择大的,最好有一些超过10,000个实例和100个属性的数据集,因为太小了审稿人可能觉得说服力不够。
9. 实验比较的时候尽量选择跟原文一样的数据集,这样保证站在一个起跑线线对比更有说服力,而且在这个数据集上选择的对比算法在选的参考文献已经跑出结果,可以直接比较而不用复现别人的程序。但是这样对比需要足够大的勇气,因为别人已经发表出来,那他的模型在他给的这个数据集中参数肯定是调成最佳了,效果肯定是非常好的。
10. 由于比原数据集很有可能比不过,那么找论文的时候尽量找提供算法源代码的论文,然后复现他的程序,都在我们自己的数据集上跑,再来进行比较。
11. 实验结果不应该都用图表和表格表示。应该更具体的数据集选择适当的显示方法
12. 如果有些时候不知道如何直接表述自己的实验目的时候,不妨采用自问自答的方式。提出几个问题,最后通过实验结果来回答这些问题(一般问题不宜太多3~4个较为合适)
13. 实验比较分为内部比较和外部比较;
首先内部比较:是比较自己的算法中不同参数引起的算法性能的比较,对那些对算法性能影响较大的参数进行讨论分析。以及主要方法和该方法调整方法一个对比。
外部比较:是同一个问题将自己的算法与现有的方法(Both classical/baseline/benchmark and state-of-the-art approaches )进行各方面的比较,一般对比算法为6~8比较合适,如果太少的话审稿人也会叫加的。比较结果一般以直方图跟表格的方式呈现,这样既直观又美观。

Conclusion and further work (总结与展望)

终于到达最后的部分啦,这个部分是很多读者都很喜欢阅读的部分。

  1. 总结的话一般用五句话来说就足够了。
  2. 总结的句子别避免跟摘要的句子重复,虽然感觉总结和摘要的内容有些几分相似,但实际上总结更加强调的是通过实验观察得到的结果,比总的概况更具体。
  3. 在说进一步工作的时候尽量多谈几个点(3~5)个,这个读者非常感兴趣的,不要藏着掖着,大大方方讲出来,计算机行业已经足够卷了,我们要开放才能进步。你想,前期工作都是自己做的,后面的系列工作还怕别人给抢去了吗,这显然是对自己不自信嘛。而且,审稿人看到这里的时候,反而认为此人豁达,有一个很好的印象,甚至可能期待该作者的后续系列文章。而且,提及了未来的打算和后续工作,大多数人看见这种类型的系列论文就心花路放,这引用还不蹭蹭蹭往上涨呀。

到这里纸上谈兵就基本上结束了,如果有什么表述不当还请指出来,祝愿看到此帖的诸君都能顶刊顶会发到手软。
在这里插入图片描述

  • 1
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

Asita_c

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值