前言
这学期学习了闵帆老师的《论文写作》课,在课上闵帆老师深切地像我们讲述了如何写好一篇学术论文的经验,在这门课的学习之后,我感触颇多,在此用写博客的方式记录和总结这门课的内容和我自己的一些学习心得,以便日后书写学术论文时有所参考。附闵帆老师的《论文写作》专栏地址,方便学习:论文写作_闵帆的博客-CSDN博客
第一节 学术论文的基本概念
1.学术论文的定义
学术论文是对研究工作进行阶段性总结的文献形式。单篇论文的内容不需要太多,重点是突出创新点。如果有一系列相关工作,可以写一系列论文。闵帆老师还提到,学术论文不应该强行灌水,特别是对于已经有10+学术论文的学者。
2.写学术论文的原因
首先,写论文是达到毕业条件的必要步骤。其次,写论文可以用于评职称。不过更重要的是,写论文也是传承知识和进行学术宣传的方式之一。例如:有些人将论文放到ArXiv等网站上,但并不投稿到正规期刊;有些人在CSDN等平台上写贴子,但并不利用它们赚钱。
3.写学术论文的方法
首先,需要阅读相关文献,并总结出自己的模板。对于计算机学科来说,需要查阅顶级期刊和会议的论文。另外,可以使用别人总结的模板进行写作。
4.写学术论文的时机与地点
越早越好!越早越好!越早越好!闵帆老师给我们强调,学术论文的写作应该越早越好,甚至在本科阶段就可以开始写,千万不能超过研一下学期,不然研究生真的可能无法毕业!而且论文不用等到工作完成以后就开始写,在工作进行的同时就可以开始写作论文,提高效率。至于写作的地点,那就是任何地点!
第二节 常见的Latex格式文件
- 每种期刊都会提供一个或多个格式文件. Latex 源文件只需要进行少量改变, 就可以获得完全不同的版面.
- 基本准则,不要从头写!最好找该期刊已录用论文的源文件,其次找该期刊提供的模板文件,总之,多借鉴模板。
- Latex的使用虽然比Word复杂,但是选择好模板后Latex在格式方面比Word易于调整
这就让我回想起本科毕业论文时指导老师让我改格式时的痛苦了,以后我一定用Latex写学术论文!
该节内容列举了常见期刊的Latex内容,详情可参考闵帆老师博客。
这节课上我第一次认识了Latex这一论文写作工具,颠覆了我本科阶段只知道word可以写论文的认知。
第三节 慎用的单词与短语
- 基本准则:一般而言, 未出现在任何学术论文中的单词, 不可以使用.
- 正式论文的书面英语中,不应该用带撇号的简写。
- 除了童话, 没人在句首使用 and.
- 实验结果只能表明 (show) 而不能证明 (prove) 某个规律, 如你的结果比别人的好. 仅当你写了定理、性质及其证明过程, 才能说 prove.
- 可以使用 https://www.linggle.com 查看单词或词汇的使用频率.
这一节我觉得最意义的就是Novel(新颖)和New(新)的区别。闵帆老师说,只要是一篇论文,肯定要么涉及new问题,要么涉及new方法,new就是一个很正常的事情。但是novel可不一样,成分更加夸张,表示比较大的创新,会让审稿人对这篇论文有一个更高的预期。所以这个词要慎用,如果被审稿人发现你是在吹牛,就会被拒掉。但是如果在顶刊顶会的话,如果都不敢用novel,审稿人也会小瞧你,综上,具体情况具体操作。
第四节 彻底解决英文句子的语法问题 (好的中文 = 好的英文)
- 总结句式是解决语法问题的正解. 虽然开始的时候费力, 但贵在简单、有效.
- 要写出一个好的句子,有两种方法,分别是借鉴法和倒腾法
- 借鉴法:找 20 篇顶刊的论文->找出各个部分的简单句子->获得其句型->自己论文中使用
- 倒腾法:英->中->英->中->英->中->英……(最好从英文句子开始)
其实闵帆老师是在告诉我们,新手从一开始就应该去借鉴或者使用翻译工具反复修改句式,因为我们没有经验,不可能一来就达到学术论文专业句式的水平。一定要多学习,多借鉴,多修改。
第五节 符号系统与数学表达式
- 对于某一个研究小组, 符号系统总结好了, 就可以重复使用。
- 如果论文涉及不少数学符号, 应该给出一个符号表, 便于读者查阅。
- 严禁先用 Word 里面的公式编辑器写数学式子,再转到Latex。
数学式的书写就不要用word了,要一直用Latex,不然很容易出现格式问题,从数学式的格式就能看出这篇论文和作者的水平。数学表达式一定要去认真学习,闵帆老师建议我们找一篇已经发表论文的 .tex 文件来学习数学表达式。
第六节 给自己的论文一个中肯而闪亮的题目
- 题目对于论文来说至关重要. 如果说论文是孩子, 那么题目就是他的名字
这很容易理解,从小学开始学习语文课的时候,语文老师就告诉我们题目是文章的灵魂,论文作为一种形式的文章,也理应如此。
题目应该具备以下条件:
- 必须有吸引力
- 必须易于理解
- 应该易于检索
- 长度最好控制在40-60个字母之间
- 尽量不使用based on
- 使用through,with等来表示技术
- 如果主要贡献为算法,题目的缩写就应该为算法的名称
题目做为一篇论文最先让读者阅读到的部分(比摘要更早),理应该反复推敲,要有足够的吸引力,创新性,同时不能脱离论文内容,要中肯合理。所以闵帆老师在课堂上对我们强调,题目一定要反复去修改,随着论文写作的进行,原先预定的题目可能会偏离航线,要适时对题目进行更新,没有人能一开始就想出一个完美的题目。
第七节 摘要10句
从中文的角度, "摘要"就是把论文重要的内容摘录出来; 从英文的角度, Abstract 就是把重要的内容抽取出来。
闵帆老师的规范10句:
- 问题及其重要性
- 已有工作
- 已有工作局限性
- 本文工作
- 本文方法的第 1 个技术/步骤/方面/优势/贡献
- 本文方法的第 2 个技术/步骤/方面/优势/贡献
- 本文方法的第 3 个技术/步骤/方面/优势/贡献
- 实验设置
- 实验结果
- 提升
其实写论文就像写八股文,我们从前人的经验中总结合理科学的结构并且运用到我们自己的论文中,就能让我们的论文在格式和结构层面不容易出错,提高通过审核的可能性。例如闵帆老师总结的这10句摘要,既能够保证摘要的字数,也能保证摘要的质量。
第八节 关键词的写法
- 关键词是用于检索论文的一种重要的方式
- 关键词常被看作摘要的一种补充
于我个人而言,快速筛选对我有帮助的论文的时候,看关键词比摘要的效率更高。
- 一般需要 3–5 个关键词
- 关键词一般由 1–3 个单词构成
- 将关键词按照字母表排序
- 有些期刊支持两类关键词
第九节 引言需要讲述完整的故事
"引言"的本意是为论文作一些铺垫, 然而, 在计算机英文论文中, Introduction 需要讲述完整的故事. 近年来, 一些好的中文杂志也逐渐采用了这个风格。
- 引言的层次
7.1 没有拼写、语法错误(单词级)
7.2 表达简洁、得体、有力量(句子级)
一个意思用尽可能短的句子描述。不需要太多的句式,少数的几个重复使用即可。
7.2 丰富(段落级)
同一事情从不同的角度分析,有一些常用的角度、招数
WWH: what, why, how
7.3 条理清晰,节奏明快(章节级)
主要是摘要10句及相应的节奏
7.4 创新
引言应该对整个故事进行详细的描述,如果说摘要是电影 5 分钟宣传片的话, 引言就应该是整个的剧本。很多审稿人在读完引言后, 就有了基本 (80% 以上) 的判断。
第十节 文献综述不可进行简单的罗列
- 绝大多数的参考文献应在文献综述中引用
- 文献需要进行分门别类的介绍
- 不要一次性引用太多文献
- 不提倡全句引用
像我之前本科写论文时就常常对参考文献进行全句引用,没想到这已经涉及学术不端的问题了,感谢闵帆老师讲到这一点,以后的学术论文一定不能再去做这样的事情。
第十一节 理论部分全靠数学功底
一般性的准则如下:
- 理论应该完备
- 符号要保持同一风格
- 重要结论称为定理 theorem, 定理前面打辅助的叫作引理 lemma, 定理后面的尾巴叫推论 corollary, 附属于算法的叫 property.
闵帆老师在课堂上要求我们重新回顾一下以前学习的数学教材上面的定义书写方式,例如《离散数学》。数学语言是完备且言简意赅的,非常值得我们去参考学习。
第十二节 算法伪代码
算法伪代码是论文的核心之一.
- 需要说明输入、输出;
- 方法 (函数) 名可写可不写, 如果被别的方法调用就必须写;
- 需要写出主要步骤的注释;
- 长度控制在 15-30 行;
- 可使用数学式子或对已有数学式子的引用;
- 不重要的步骤可以省略;
- 一般需要进行时间、空间复杂度分析, 并写出配套的 property 以及相应的表格, 以使其更标准。
作为计算机相关专业的学生,我们的论文是离不开代码的支撑的,代码是我们的成果,也是读者检验我们论文成果真实性的方式。我们在设计算法伪代码时,就应该格外注重时间复杂度和空间复杂度的分析。让我们的论文显的标准和科学。
第十三节 实验部分是重头戏
一.数据集信息
数据集越多, 覆盖领域越广, 结果就越可信. 从软件测试的角度也是如此。
获取自己主要参考文献中的数据, 有利于进行比较
我的理解是,数据集的规模是可以直观展现我们论文的工作量,如果数据集太小,显得工作很儿戏,也没有说服力,准确性堪忧。
二.自问自答模式
采用自问自答的方式,在实验之前提出问题,实验结果列出之后再对前面的问题进行回答。但有些审稿人不喜欢这种模式,他提出再进行修改。
三.内部比较
内部比较的动机包括:
- 展示参数变化所导致的性能变化.
二维图一次只能展示一个参数和一个性能指标. 因此, 如果有很多参数, 就只能讨论最重要的几个, 否则图太多. - 展示主要方案与其变种相比的优势.
有时候我们有好几种可选方案, 通过比较, 可以获得最佳那个. 只有在国内获得冠军, 才出去参加奥运会.
相当于我们自己要从工作中挑选哪些参数更具有价值,然后写上论文,而不是一股脑全怼上去,显得我们水平很低,只知道罗列,不知道抓重点。
四.外部比较
外部比较即与已有算法进行对比
- 需要比较经典方案, 基准方案, 最先进的方案.
- 很多时候使用柱状图.
- 如果数据太多, 用表格就比图合适.
- 如果要把参数影响, 数据集大小影响也表现出来, 就只有用折线图.
- 最重要的比较放在最后.
- 要有足够的文字进行分析, 不能让读者自己去观察.
- 并不需要在所有数据集上击败其它方案.
- 在分析自己方案优势之余, 也应该分析它的劣势, 否则审稿人不干. 因为机器学习的基本规律就是 No free lunch, 即一个方案既然有优点, 就肯定有缺点. 既然有擅长的数据/指标, 也就有不擅长的数据/指标.
这一节内容就是我们论文重中之重的关键,我们的论文就是为实验而服务的,实验的成果是通过论文展现的。一定不能对数据进行造假,论文发表以后会永久保存在网络上,完全有可能会被查出学术不端行为,对我们的影响是终生的。
第十四节 结论不要太啰嗦,但进一步工作可以
作为人们的阅读习惯, 最后一部分总是要看的. 通常审稿人和读者都会逐句阅读本部分。
- 常言道: 虎头豹尾. 结论一般不要太长, 5 句就够了。
- 避免使用与摘要内相同的句子。
- 如果要讨论说进一步工作, 可以列出 3 至 5 条, 不算在 Conclusion 的字数里面。
给读者留下后续工作是一件很好的事情,一个领域的发展都是学术界的大家一起推动的,把后续工作留给读者进行进一步研究和优化,是对整个领域都有益的,千万不能把发展的道路堵死。
第十五节 参考文献部分隐藏的错误超过你的想象
- 千万不要直接使用网上的 bibitem
- 将等号进行列对齐
- 名字要有意义
- 名在前, 姓在后
- 作者名不要缩写
- 注意题目的大小写, 可以用花括号强制设置
- 期刊的名字按照正常方式写即可
- 会议名如果使用简称, 就不要再写全称
- 由于有 year 域, 不要在会议后面再加年份
- 页码之间应使用两个连词符 -, 最终的效果就是一条比较长的横线
- 特殊字符需要使用转义符才能正常显示
- 千万不要把特殊字符 (包括全角的引号, 头上戴点的字母等等) 拷贝进 bib 文件
- 除最后一行外, 其它行应以逗号结束
- 有些作者喜欢在名中间连词符
- 为了保证格式的正确性, 应检查生成的 pdf 文件
参考文献不是简单的复制就了事,一定要注意以上提到的问题。每一个小问题都有可能导致审稿人对我们的文章有所不满。
第十六节 图片与图摘要
一幅图胜过千言万语. 把图画漂亮是硕士毕业的必要条件
- 尽可能使用矢量图。
- 建议不要使用 Excel 画图, 太丑了。
- 图注可以相当长。
- 围绕图的说明性文字应该比较长。
- 彩图很贵。
- 一般而言, 引用图片时, 应保持与图片编号的一致。
- 有些期刊要求提供 Graphical abstract, 即使用一张图 (含图注) 把论文的主要思想介绍清楚。
我认为,论文中插入的图片是相当重要的,它能让读者更加直观的理解你的工作内容。所以说我们在画图和插入图时,应该严格注重格式和方式。
第十七节 Latex表格的控制
- 表格一般应该与文字边距相同. 如果表格内容不多, 可以用语句控制宽度。
- 如果数据太多装不下, 也可以用语句控制宽度, 但表格中字体会自动缩小。
- 对齐方面, l 表示 left, c 表示 center, r 表示 right。
- 所有列都为左对齐, 使用 0.0000 而不是 0 来保证对齐。
- 粗体指示最好的效果, 斜体指示次好的效果。
- 数据集应按照某种方式排序, 如对象数、属性数、来源领域等, 并保持所有表格中的顺序一致。
- 大于 1000 的数据应该用逗号隔开, 如 1,024。
这节闵帆老师主要讲了用Latex制作表格时所应该注意的规范和习惯,对我们写作论文有很大的帮助。
第十八节 审稿意见回复要直截了当
稿件投到期刊, 如果编辑让你修改, 多半就有戏了. 在修改论文的同时, 需要准备一个 point-to-point 的回复. 几点注意事项:
- 思想上务必要端正态度, 编辑和审稿人花大量时间义务审稿不是想为难你, 而是来帮助你改进论文质量.
- 问题应该直接回答, 而不要顾左右而言他.
- 回复不要太长, 正文中进行相应的修改才是重点. 审稿人更关注你正文修改得如何, 毕竟它才是呈现给读者的内容.
- 正文中修改部分应用蓝色字标出.
- 审稿人的拼写错误要帮他纠正.
态度端正,直截了当,与审稿人保持友善的交流能够帮助我们的论文更成功地发表。(和审稿人过不去就是和自己过不去)
第十九节 会议论文与期刊论文的区别
论文被会议录用后, 适当增加一定 (如1/3) 的新材料, 可以再投到期刊
期刊论文和会议论文有区别,会议论文均有篇幅要求, 一般比期刊论文篇幅要短
为了准备会议论文, 需要注意以下几点:
- 先写一个完整版.
投稿前再根据篇幅要求进行修改. 也可以等论文发出来后再转投期刊作准备. - 严格按照篇幅要求排.
既不能多, 也不能少. 例如, 要求双栏 8 页, 就需要写到 7.8 页. 最后空 5-6 行即可. 否则审稿人觉得你连这些篇幅都写不够, 能力不行.
会议投中后转期刊需要给期刊进行说明,避免学术不端的风险。可以先提前写好期刊论文,再根据会议论文的要求进行修改。
- 论文被会议录用后,适当增加一定 (如1/3) 的新材料,可以再投到期刊。
- 会议论文没有章节组织描述。
- 会议论文相关工作描述比较少。
- 会议论文实验比较少。
- 会议论文不讨论 future work。
- 会议论文参考文献较少。
理清会议论文和期刊论文的区别,才方便我们选择哪种发表和修改。
第X节 不可原谅的低级错误
- 大小写
- 空格,如标点符号后面缺少空格,标点符号前面多了空格等,小括号前少了空格,参考文献引用的方括号前少了空格,连续几篇文献的引用之间多了空格等。
- 全角符号,Latex中不应该出现全角符号。
- 引号
- 数学符号,符号应规范, 且保持同一篇论文中的一致性;严格禁止使用 Word 的公式编辑器写式子, 然后转到 Latex 源文件。
- 数学式子涉及的标点符号,数学表达式是句子的一部分, 所以也需要符号。
- 标签,为方便交叉引用, 每个小节、图、表、参考文献都应有个标签,且应该避免重复和缺失。
- 句子,影响阅读的长句、不完整的句子、基本语法不正确的句子、单复数使用错误的句子、第三人称的句子还有同一词组在同一句子中重复出现这些情况都是不可原谅的低级错误。
- 文字格式,强调文字使用 \emph, 如果使用 $ 符号括起来就错了。 后者有更大的间距, 很容易看出。
- 宽度,注意表格宽度和数学表达式的宽度
- 图片,一定要使用矢量图,不然放大后就是马赛克;流程图必须严格按照标准画。
这些低级错误甚至会导致我们被拒稿,拉入黑名单,后果十分严重,我们应该非常重视,千万要反复整改检查论文,避免这些低级错误。
总结
闵帆老师的《论文写作》课让我收益颇丰,我作为一名刚刚入学的研究生,以前从未接触过科研,对学术论文写作这一领域相当的陌生。经过闵帆老师的讲授,我不仅对学术论文的写作规范有了一个初步但全面的认知,还理解到了一些低级错误会对我们的学术生涯造成极大的影响。十分感谢闵帆老师对我们的教导,今后的科研路途中,我还会时刻翻阅闵帆老师的博客,加深对论文写作的理解。