目录
前言
理解下述三个问题:
学术论文是什么:对研究工作的阶段性总结,单篇论文有一到两个创新点,在正确的部分填上正确的内容,保证结构清晰。
如何写学术论文:作为初学者,可以先从别人的模板上改写。同时要读文献,积累文献包括20篇以上的顶刊顶会论文。
会议论文与期刊论文的区别:会议论文篇幅一般比期刊短;没有章节组织描述;相关工作描述较少;实验较少;不讨论进一步工作;参考文献也较少。
1.标题和摘要
1.1标题
一个醒目悦耳的标题可以极大提高读者的兴趣,科技论文的题目往往是短语或完整的句子,可以发挥自己的想象力,将本研究最核心的发现用最简练的词句表示出来(有吸引力,标题精简但又新颖);这里注意选择必要的关键词时,要便于潜在读者进行检索,进而提高自己文章的影响力(易于理解和易于检索);有些杂志对题目的字数有明确限制,需要格外注意(字数限制)。(尽量不要用based on,基于)这样会让审稿人觉得只是一个简单的扩展或者简单的应用。并且在中文期刊中“基于”题目实在过于泛滥。
1.2摘要及关键词
1.2.1摘要
摘要是对标题的扩充,一般包括简单总结文章的背景、所要解决的问题,及对应的研究方法和策略、得出的结果和结论。
应当遵循一定的形式套路。背景---两三句话简短中肯地提一下本研究领域的概况,同时对主要研究目标进行陈述;方法---讲述所用主要的研究方法和策略;结果---首先列出主要结果,然后列出次要结果;结论---一句话总结你的主要发现,
1.2.2关键词
关键词写于摘要之下,作为摘要的一种补充。关键词是用于检索论文的一种重要的方式. 虽然现在人们可以进行全文检索, 但关键词仍然很常用。
一般需要3-5个关键词,每个词都代表文章的核心要素。
(英刊每个关键词由1-3个单词构成)
(英刊关键词按照字母表排序)
(英刊有些期刊支持两类关键词,由期刊提供的index term和作者自己写的keywords)
2.正文
2.1引言
如果引言写得漂亮, 审稿人就会在后面的正文中找出一些证据, 赞扬研究工作有意义, 理论完备, 实验效果好等等,相反,如果写的难看,审稿人随便找几个问题就pass了。
该部分要简明扼要的介绍该研究的背景知识,结合和本文内容相关的文献,评析它们的研究所存在的问题,然后引出自己想解决的问题,最后介绍本文的贡献。
注意介绍部分内容不要偏离主题,每句话都要有目的性,这也是杂志社限制字数的原因之一;不要担心写的内容出现重复,这也侧面反应了自己时刻清楚自己写的内容,也加深了编辑和审稿人的印象。
2.2问题建模
基于常用的建模方法,对研究对象进行数学建模。
2.3研究方法及分析
基于所要解决问题的方法阐述,逻辑要清晰,文中所写的公式每一个字符都要进行解释。
2.4仿真(伪代码)
进行仿真实验,并对仿真所得到的图(规范的形式与坐标,直接明了,不要有冗余)进行合理分析,证明理论。
一般来说,先写好大概的代码,再进行精简,最后才复制到论文里。
对于一个简练有力的伪代码,应该有这几个特点:
- 需要说明输入、输出;
- 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;
- 需要写出主要步骤的注释;
- 长度控制在 15-30 行;
- 可使用数学式子或对已有数学式子的引用;
- 不重要的步骤可以省略;
- 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准.
2.5实验结果及分析
在实物上再次进行实验(要详细介绍所用的实物),并对实验所得到的图(规范的形式与坐标,直接明了,不要有冗余)进行合理分析,证明理论,
对于大部分机器学习论文,实验部分占了一半的篇幅,所以实验部分十分重要。
- 数据集:数据集越多,越广,实验数据就越多,实验结果也就越可信。一般来说10-20个数据集就足够了,对某些领域而言也可使用人造数据集。尽可能使用大些的数据集。
- 对比实验:获取自己主要参考文献中的数据, 有利于进行比较。要么获得对比算法的源码, 要么实现它们。
- 同一结果不应该在图和表中同时出现。
- 实验的主要目的是回答一些读者关心的问题,所以可以采用自问自答的方式在实验前提出问题,在实验结果后逐个回答。
- 内部比较:只要是表现得是一些参数得变化对性能得影响,并且选择效果最好得参数,还可以展示主要方案和其他变种得优势。
- 外部比较:和现有得方法比较,需要和最先进,最好得方案比较,通过图表表示是一个比较好的办法,清晰有辨识度,有图得同时还要附上文字解释,让读者理解得更透彻。
2.6 总结
- 不要太长的结尾,结论部分主要是描述本研究发现了什么,没有必要描述实验或分析方法,尤其不要与摘要重复。结论应该关注结果而不是内容。 要注意结论与摘要的区别,有时需要阐明未来研究方向。
- 如果有进一步工作,则需要列出3-5条。这里读者会尤其关注,因为读者可以沿着该思路一直研究,能够增加该论文的引用量。
2.7延深
2.7.1图片处理
论文中的图片不仅很难画,而且很费时间,但是把图片画好是论文写好的基础。
- 最好去使用python和matlab画矢量图,不要用excel画。
- 图注可以长,用几行描述该图片的内容。
- 保证自己的图在黑白打印的情况下仍然可以表达自己的意思。
2.7.2审稿回复
稿件收到回复的时候,说明有希望被纳入了,这个时候千万不能着急,心态要摆好,态度摆端正,礼貌简短的回复审稿人的问题,不要答非所问。然后重点还是在论文的修改上,修改内容一定要用蓝色字体标记出来。
2.7.3如何避免拒稿
- 低级错误不要犯(论文格式要,公式表达,图片呈现,逻辑表达都要准确)。
- 实验数据保证充分,数据集尽量多,尽量覆盖范围广;增强理论,数学表达式一定要能够算出来且能处理问题;创新点一定要足够新颖,足够体现工作量。
2.7.4写稿步骤
第一稿写完后,给自己不要超过一天的休息时间,开始修改第二稿。修改时,还是以逻辑为主,但对每一句话都要推敲一下,对abstract和正文中的关键语句要字斟句酌。学会用“Thesaurus”(同义词替换)以避免过多重复。第二稿的修改极为关键,再往后就不会大改了。
第二稿以后的修改,主要注重具体的字句,不会改变整体逻辑了。投稿前,一定要整体读一遍,对个别词句略作改动。记住:学术期刊一般不会因为具体的语法错误而拒绝一篇文章,但一定会因为逻辑混乱而拒绝一篇文章。
3.研究思路
3.1论文阅读
发表论文的前提是大量阅读论文!!!文献阅读分为三个阶段,初期找方向,中期重点突破,后期广泛涉猎。
初期读论文:需要逐字精读,方向不必严格限定,感兴趣论文涉及的论文链都可以去读。一篇论文用时一天,英文论文+中文分享,前期阅读论文数量30篇以上,可以提高学术英语阅读能力和专业术语积累。
中期读论文:要重点精读,严格限定研究方向和方向涉及的论文链。重点论文时间控制在半天,泛泛论文是一小时,重点论文重复读+源码学习,论文阅读数最好为10篇以上。了解学习技术演进、学习方法创新和整理创新方法链。
后期少数精读+大量泛读:不限定方向,自己重点方向+涉猎方向。
重点论文两小时,泛泛论文半小时,跟随研究方向的最新发展,了解其他方向的大致进展,思考创新点引进嫁接。
3.2研究方向
3.2.1寻找研究方向
- 我们要在课程中寻找,在读书中发现问题,这些问题可以是学术界尚未解决的问题,解决的不够好甚至有错误的问题和纯粹的新问题。
- 读书中发现某位学者解决的不彻底,不完整甚至不对的问题或者发现新问题,这事最常见的寻找论文题目的方法
- 我们可以针对一个感兴趣的问题写一个综述,在归纳中寻找新问题。
- 我们可以关注各种研究生论坛与各种学术会议征稿,有针对选取,这样还可争取到参加学术会议和发表的机会。
- 我们也应该经常浏览好的学术期刊,关注学术界的动态和热点话题。
3.2.2需要规避的研究方向
- 已有较多研究成果且无法提出新方法问题。
- 选题难度过大,啃不动的问题。
- 无法找到足以支撑论文的相关材料的问题。
但我们可以把这些题目记下来,以后进行研究。
3.3寻找创新点
可以从以下四个方面确定自己论文的创新点:
- 数据集的改动:噪声、几何变换、遮挡、光照条件、场景依赖
- 模型的问题:模型体积、推理速度、收敛困难、非端到端、后处理优化
- 结构替换:transformer、FCN、AE等
- 特定场景的应用:通用模型考虑泛化能力—特定应用考虑专用性。比如夜间检测、水下检测、鱼眼相机检测。
另外就是要记住A+B+C/2.5法则:
- A:本研究方向的继承性创新点(自然演进)
- B:其他方向的既有方法(嫁接到其他任务)
- C:细节上的创新(数据增强/数据集/损失函数设计)
举例:这篇CVPR2021: CutPaste,运用的就是A+B+C/2.5法则。
A:自然演进 cutout—cutpaste+B:既有方法 将自监督学习的pretask应用于异常检测+C:细节创新 高斯概率密度估计(GDE)判断异常
3.4代码复现
原则:1篇论文代码复现(至少读懂代码实现)>>跑通多个项目demo
- 找到baseline论文的代码;
- 在baseline代码上实现期望功能的最小化实现;
- 逐步实现最终的功能代码,同时做实现验证各部分设计的效果。
3.5写作工具:LaTex
- 从现在开始写论文就要用latex来写,因为它的排版十分工整,避免了使用word写了之后还要重新排版。最好找期刊已录用论文的源文件或是该期刊提供的模板文件,而不是从头开始写。
- cls文件是用于控制论文的总体格式,bst文件适用于控制参考文献的格式。各个期刊和会议论文都有其不同的latex格式,我们写的时候只需要在借鉴的模板上进行少量改变,就会更高效率的完成写作任务。
- 把握好latex对于数学公式和符号是非常方便的,因为不需要重新处理排版问题。
- 在latex里面,对于一般的变量直接将数学表达式用$符号括起来就行了,若是集合、数组、向量等则需要使用粗体。
- 对于不同字体的同一字母也有不同含义,所以要检查符号系统的一致性。如果论文中涉及很多数学符号,应该给出一个符号表。
- 数学式子是句子的一部分,如果太长就用latex里面的切分句式来自动分行,并且数学式子应该存在相应的逗号、分号、句号。
- 我们初学者最好找一篇已经发表的论文的.tex文件来学习如何书写数学表达式。
4.投稿须知
4.1期刊选择
- 在发表文章前,我们应当了解各个学术期刊,对自己要发表的学术期刊有个大体的认识。
- 投稿要具有针对性,不要太高也不要太低。
- 要遵循期刊的写作规范,符合期刊的规则与要求。
- 要了解期刊风格、特点,关注期刊目前在关注的问题与热点。
注意事项:在与期刊打交道时,首先,我们要善于推荐自己,端正自己的态度,不要群发稿件,遵守学术规范,提供自查复制率报告,注重细节。其次,要善于交流,熟知期刊基本信息与最新动态,试着给编辑写信。
4.2评分标准
我们对一篇学术论文质量的评价标准分为形式标准和内容标准。
形式标准:学术论文都有一定的形式规范,构成了论文的形式标准
内容标准:指创新性,包括新观点、新方法和新资料(至少其一)。
最高层次的创新是原创,评价文章原创性的几个标准如下:
- 独自的理论系统;
- 独有的理论概念;
- 独特的理论观点;
- 独创的理论方法;
- 独门的研究材料。
完成学术论文的条件: 学术功底和写作技巧,大量的论文在编辑眼中很少能超过2-3分钟,如果超过5分钟,那么很大可能被录用
4.3发表论文的意义
- 我们要明确为什么要发表论文。发表论文可以注册研究成果的原创性,表明自己是第一个发现问题答案的人;
- 科学家通过论文来发表重大突破的实验细节,其他人可以重现其方法和结论;
- 通过发表论文可以通知同行你的研究进展,避免重复劳动;发表论文可以得到同行的评论和建议。
4.4投稿标准
- 我们可以检查自己的研究成果是否具有原创性,
- 是否对既有研究有重要提升作用,
- 是否对本领域有鲜明见解并可以做一个回顾和总结。
有价值的论文,其科学信息是清晰的,有用的,同时具有逻辑性的表达要传递的信息,让读者能够较容易的明白你研究的重要性。
4.5学术伦理道德
作者要保证数据真实不伪造或篡改,保证研究原创性,坦言告知可能存在的任何利益冲突,避免一稿多投。
5.SCI写作
施一公:初到美国之时,对英文环境适应得很差,读一篇《生物化学杂志》(JBC)的文章要五六个小时,还常常不理解其中一些关键词句的意思,压力极大。后被建议,“每天花45分钟读《华盛顿邮报》,两年后你的写作能力会得心应手”。刚开始,一个小时只能读两三个短消息或一个长篇报道,中间还不得不经常查字典看生词。但不知不觉间,阅读能力明显提高。1992年老布什与克林顿竞选总统,我跟踪新闻,常常一个小时能读上几个版面的消息或四五个长篇报道,有时还把刚看到的新闻绘声绘色地讲给师兄师姐听。
要写好科研论文,必须先养成阅读英文文章的习惯,争取每天30~60分钟。刚开始可以选择以读英文报纸、英文新闻为主,逐渐转为读专业杂志(根据个人英语基础和时间)。
5.1语言表达
一般来说,未出现在任何学术论文中的单词是不能被使用的。最好找大家常用的单词,比如使用https://www.linggle.com网站查看单词或者词汇的使用频率。
- 我们要保证英语语法的正确,例如so、thus、moreover不能用来连接两句话,应分成2句话来写。
- Have’t 与 Don’t此类不正式的缩写是不能用于论文这种正式文献中的。
- 像我们在写英语作文的时候为了保证句与句之间连贯的逻辑会在句首加一个And,但是这个and没有任何实际含义,这类就可以省略避免滥用。
- easy,simple,solve,novel,prove等词在论文中使用是不够严谨的。像easy,simple表示简单的含义,而简单的东西是不具有研究价值的。solve在数学中是彻底解决某一问题,而在计算机中像机器学习领域只能做到处理handle或是address。novel一词比较夸张,表示极大的创新,审稿人会拉高期望,所以用new代替更好。prove是证明而不是表明,也是用词比较慎重。
- 我们要拒绝中式英语,要用英文的逻辑来书写论文;
- 要保证逻辑严谨,不要使用未定义的术语,不要反复叨念,同时要有语句上的逻辑。
- 我们要准备好一本English List,用于记录我们在阅读英文文献时看到的好的表达方法。
- 我们需要对文章进行润色,例如进行同义词的替换、句式的变换,同时也要注意公式和符号的规范。
学术写作常用词组与句式:学术写作常用词组与句式
写作常用句式总结:SCI写作常用句式总结
5.2写作技巧
借鉴法:其基本步骤就是找20篇顶刊的论文,找出各个部分的简单句子;如 The main idea is to estimate the total energy consumption by summing the energy contributions of each instruction.然后获得其句型,如 The main idea is to … by …;然后运用到自己的论文中。最好从现在开始积累,通过句子出现的位置分类来总结,注意时态和语态。
倒腾法:步骤是写一个表达自己意思的英文句子,然后谷歌翻译成中文,再翻译成英文,反复直到中英文不再改变。这种方法极为耗时且对于新手小白来说中英文表达清楚都是比较难的。
对我来说,我会选择第一种方法,先去借鉴借鉴别人的句式,少来一些英文中复杂句的炫技,表达清楚就好。
5.3日常积累
- 我们要在日常学习研究中进行笔记积累。记录详细的实验细节、自己的新想法专业知识、概念以及理论进展等。
- 要积累文献。可以订阅期刊,关注国内外研究组的网页(RSS源订阅、邮箱订阅)。保证每个月2-3篇文献的精读,主要选择本领域的重要文献,同时也要进行泛读,先读摘要部分,看看有没有读下去的必要。
- 我们要学会对文献进行分类管理,可以手动分类也可以使用一些文献管理软件。
- 在写作上,我们的图表的坐标轴一般在4-6个刻度,字号要够大,重点内容进行突出表示,颜色对比鲜明,如黑红蓝、红蓝绿等,图表要简单、直观、有深度。
5.4一个重要方法
找一篇英刊,翻译成中文,一个月后再将中文翻译成英文和原英刊对比。
参考文献
1.闵帆老师论文写作课心得体会——如何写好一篇论文_Augemstern的博客-CSDN博客
2.【精选】如何写一篇优质论文_如何写好一篇学术论文-CSDN博客
2.论文写作全攻略|一篇学术科研论文该怎么写_计算机视觉研究院的博客-CSDN博客
3.如何写好科研论文(学习笔记2000字)_如何写好科研论文笔记-CSDN博客
4.如何写好科研论文(笔记)_如何去选取第一批要阅读的论文?-CSDN博客
5.如何写好科技论文_科技论文的写作思路_「已注销」的博客-CSDN博客