黄哲威与丁霄汉为初学者撰写AI会议论文写作手册，独具一格！

最新推荐文章于 2024-11-24 14:21:51 发布

zenRRan

最新推荐文章于 2024-11-24 14:21:51 发布

阅读量523

点赞数

文章标签：人工智能

原文链接：https://mp.weixin.qq.com/s?__biz=MzI3ODgwODA2MA==&mid=2247530294&idx=2&sn=6d9419cb01cc9296990623f9f205d2ad&chksm=eabb2397fd7ea1215e4e952c1c7cc3686cfe07c79a132bf7f5d6b925d194bf856a6f563f9343&scene=126&sessionid=0

版权

作者: 黄哲威、丁霄汉

知乎：https://www.zhihu.com/question/438031462/answer/3624649447
链接：https://github.com/hzwer/WritingAIPaper

摘要

对于初学者而言，撰写研究手稿可能是一个极具挑战性的过程，尤其是当离截止日期只有不多的时间且作者缺乏学术投稿经验时。准备不充分的手稿不仅会给合作者和读者带来困扰，还常常导致被拒或需要大幅修改。本文将分享一些针对初学者想要撰写AI会议论文的建议。我们的目标是使这篇文章成为初学者的指南，帮助他们更容易地分享学术成果。

引言

GPU集群已经运行了半年，你觉得结果已经有了显著的意义。你突然意识到一个即将到来的会议的截止日期不到一个月了，而你只写过一些课程作业报告。为了避免错过截止日期，第一稿应该提前多久完成？一篇优秀的研究论文和一篇糟糕的论文有什么区别？在开始写作之前应该做些什么？这些问题像噩梦一样困扰着你，让你盯着空白的Overleaf主页发愣。幸运的是，这篇文章正是为你而写。我们曾经历过被拒的痛苦和被接收的喜悦，希望能为新手提供一些见解。

本文将讨论撰写会议论文相关的方面，重点是常见的陷阱，面向初学者。文章主要包括两部分：完成论文和完善细节。我们旨在提供实用的指导，使新手能够自信地应对学术写作的复杂性，为该领域做出贡献。诚挚地，我们推荐由Chao Ma教授整理的“写作技巧资源清单”。

https://vision.sjtu.edu.cn/writing.html

从零开始构建一篇论文

本节将概述如何从头开始撰写一篇AI论文，包括结构、核心思想、框架、结果和引言。

分层结构

重点：摘要-引言-主体，逐渐展开。每个部分都是自成一体的。

论文的典型结构包括：1. 摘要，2. 引言，3. 主体，其中包含相关工作、方法论、实验、讨论、结论和参考文献等部分。我们可以将此结构分为三个层次。每个层次都应旨在传达一个完整的研究叙事。每个层次都是对前一个层次的扩展。基于这种理解，我们来探索如何有效地呈现研究故事。对于初学者，建议先专注于完成论文的主体部分。

寻找核心思想

你可能有一些有趣的发现和实验结果，但不确定如何定义核心主题。大多数已发表论文的关键贡献恰好落入以下三类之一（参考Nowozion）：

https://medium.com/@black_51980/novelty-in-science-8f1fd1a0a143

洞察力：你对已经存在的事物提出了一种解释。
性能：你能够以更好的方式做某事。
能力：你可以做到以前无法做到的事情。

找出你工作的核心优势，并在论文中早早强调它们。你还可以从其他方面扩展整体的新颖性。关键研究主题、有效的解决方案以及创新的技术贡献是构成论文新颖性的主要元素。例如，深度学习的许多早期有影响力的工作来自于基础模型研究，因为它们有潜力影响整个领域。“批量归一化”和“残差学习”等技术因其有效性而备受推崇。通过强调你工作的创新性，你将能够区分值得投入精力的方面和无关紧要的细节。

我们建议阅读一篇短文《科学中的新颖性》。

重点：清晰描述与以往方法的增量，并找到一两个核心思想。

读者在阅读论文时寻求新的见解。一篇好的论文应该有易于记忆的强点。精炼你的核心思想，直到你确信人们会渴望了解它们并广泛分享。值得特别注意的是，一些想法可能很棒，但如果缺乏原创性，不建议在论文中详细描述。

不要低估自己工作的新颖性。深入挖掘以揭示潜在的原理。如果《ResNet》论文被改写为：“我们设计了一个使用大量3×3卷积（受VGGNet启发）和并行捷径（简化自GoogleNet）构建的模型”，它也将变成一篇缺乏新颖性的论文。ResNet的主线是提出问题，抽象底层原理，提出自己的解决方案和具体实现，并通过实验进行验证。这可能并不完全反映他们的研究过程，但它有效地展示了他们的发现。

构建框架

重点：考虑目标受众，介绍有价值的发现，而非曲折的研究过程。

在遵循核心思想的同时，开始规划你打算在论文中呈现的内容。首先制作一个简单的幻灯片，向同事、同伴或导师展示你的研究方法和成果，以评估他们的理解程度。可能有意向不熟悉你工作的人寻求反馈，以找出潜在的理解差距。与实验过程不同，建议强调有价值的创新点，避免呈现不完整或复杂的研究方面。从读者的角度不断审查和完善你的展示，直到易于理解。

如果你觉得实验理由缺乏严谨性，可能还需要补充更多的实验。同时，建议进行详尽的文献研究，理想情况下找到几个主题高度相关的论文，将其视为你的论文的潜在竞争对手，寻找改进的空间。思考哪些方面会吸引学界，突出它们，尽量减少陈词滥调的内容。

让结果更扎实

重点：围绕贡献陈述，在结果部分进行扎实的分析。

许多读者最初会通过查看结果来评估方法的有效性，然后决定是否阅读整篇论文。他们会查看你的贡献是否与实验结果相符。即使你对方法的有效性充满信心，你可能仍然需要补充更多的比较和消融实验。建议创建更多的表格和可视化，选择最重要的方面来呈现。诚实和客观至关重要；夸大其词尤其不可取。如果担心过度吹嘘，建议与同行讨论。

撰写引言

关于引言的结构，我们直接引用教科书（参考Elena）：

https://www.ncbi.nlm.nih.gov/pmc/articles/PMC3178846/

步骤1：确立研究领域

a. 显示该研究领域在某种程度上是重要的、核心的、有趣的、问题性的；

步骤2：找到空白点

a. 指出以前研究中的缺口，或以某种方式扩展以前的知识。

步骤3：占据空白点

a. 概述研究目的或陈述本研究的性质；
b. 列出研究问题或假设；
c. 宣布主要发现；
d. 陈述本研究的价值；
e. 指出研究论文的结构。

附加建议：

a. 切入正题，不要写与论文主题无关的内容；
b. 尊重前人的工作，在指出不足之前肯定历史贡献；
c. Knuth: 时刻把读者放在心中。
d. 考虑使用“第一页图”来突出论文的最重要方面并吸引读者的注意力。

提高可读性

“文章千古事，得失寸心知。”——杜甫

像ChatGPT和Claude这样的智能助手可以轻松帮助作者解决英语写作中的基本问题。我们还建议中国地区的作者使用“跃问”或“豆包”。可以由工具自动处理的细节不在我们的讨论范围内。

本节通过以下概念来衡量文章的可读性：逻辑强度、可辩护性、困惑时间和信息密度。基于这些概念，本文描述了一些实用建议和技巧，以提高论文的可读性。

增强逻辑强度

重点：不要滥用连接词。

在学术写作中，逻辑连贯性比华丽的词汇更为重要。逻辑连贯性植根于逻辑本身，而非连接词。我们应将连接词视为润滑语言的辅助工具，而不是用它们来人为构建句子逻辑。连接词和实际逻辑之间的错位会使人困惑，极大地降低可读性。以下是一些具体的例子：

我们认为问题A是至关重要的。为此，我们提出了方法B。

“为此”指的是哪个目的？实际上，前面的内容只是表达了一个观点，并没有指定任何行动或目标，因此使用这个连接词本身就是错误的。连接词必须在语法上正确。

系统由三个模块组成。首先，模块A是……其次，模块B是……最后但同样重要的是，模块C是……

这里，几个连接词在这三者之间强加了一定的顺序关系，而实际上它们并没有顺序关系。我们不应该使用连接词来创造逻辑关系。更好的做法是分别介绍这三个模块。

考虑可辩护性

当我们写作时，应该考虑读者可能会对我们写的每一句话提出质疑。如果他们发现某些看起来不对的地方，可能会对整篇论文产生怀疑。为了提高论文的可信度，我们需要尽量减少被挑战的可能性。

重点：基于引用和事实做出陈述。

当我们写“问题A是该领域的痛点，尚未得到解决”时，我们应该考虑到读者可能会问：“为什么这是一个痛点？后果有多严重？这个后果对最终的性能有显著影响吗？”这需要补充适当的参考文献：

据报道，问题A导致……[1,2,3]和……[4,5]，这对于……至关重要，因为……[6,7,8]。

在讨论论文的结果时，更需要严谨：

性能有所提高，这归因于XXX……

证据应显著呈现；

性能的改善可能是因为XXX……

可以展示一些间接证据，如可视化。

尽量保持客观，避免夸大其词。

缩短困惑时间

“困惑时间”是指读者在阅读过程中从“嗯，这是啥？”到“哦，我明白了”每次所花费的时间的总和。论文的总困惑时间越短，可读性越高，读者就越平和。

重点：尽可能在提出一个概念时就进行解释。

建议在给出一个组件的名称后，直接解释其本质；例如，“我们提出了XXX，它由一个两层的多层感知机（MLP）实现。”如果一个概念不容易解释，可以通过引用文献进行补充。

重点：解决相对代词歧义。

如果无法使一个长句完全明确，那么它应被拆分为短句。很大一部分读者并非母语者，复杂的句子结构不会为你加分。

重点：经常使用主题句，最好在段落的开头。

读者可能无法迅速理解所有细节，此时可以通过主题句迅速获得主要信息，以避免影响整体阅读体验。

提高信息密度

“信息密度”指的是文本向读者提供有效信息的效率。信息密度过低可能导致读者失去兴趣，并质疑文章的专业性。

重点：尽快切入主题。

每一节的开头可能会谈到历史。尽量避免冗长。“不要写与内容无关的内容，也不应该写大多数读者已经熟悉的内容。”例如，讨论人类写作技巧的发展，肯定会吓退绝大多数读者。

重点：文字和图表应适度详略得当。

使用合适的版式来平衡文字和视觉效果。避免常见的错误，如用一个大图表来突出只有几个关键点，或是用长篇的文字来描述实验细节和超参数，而这些应放在附录中。

重点：重要的解释和说明应尽量靠近图表。

理想的情况是每个图表都可以独立于正文被理解。在图例中，尽量清楚地说明主题和关键结论。如果图表中有缩写，最好有相应的解释。

如果你想强调表格5中的某个结果，最好将分析该结果的句子放在与表格5相同的页面上，并在该句子中出现“表格5”字样。这是因为读者可能不会仔细阅读你写的文字，而是先看图表，然后寻找与图表内容相关的文字。当他们在表格5中看到引人注目的结果并产生好奇时，可能会使用PDF阅读器中的搜索功能来查找“表格5”。

不要指望读者自己从一个复杂的表格中推断出应该与谁进行比较来得出结论。我们应该明确呈现我们要比较的内容。如果难以设计这样一张表格，那么即使牺牲一点优雅，也值得在多组结果中多次重复某一结果（通常是需要比较的基线）。没有人会因为表格不优雅而拒绝你的论文，但如果表格不清晰，则非常令人恼火。

细节检查清单

首先，避免犯错。在考虑论文的美观性之前，先确保论文的严谨性。以下是一个检查清单，可以帮助作者提高写作水平：

查看所有图表以确保故事完整。力求提高图表的质量，使其具有自解释性。
检查符号、缩写和参考文献之间是否有任何不一致之处。
文本和图表的详细程度是否合适？
将重要信息放在显眼的位置。
图表中的文字和图例可以更大吗？
可以通过分栏、加粗文本、删除冗余等方法提高表格的理解速度吗？

我们将在附录中列出更多的次要项目。

结论

由于本文未经同行评审，必然存在许多不完善之处。本文中提出的概念主要来自于广泛共享的社区知识，我们努力将其综合并简化，以惠及该领域的新手。我们的目标是提供一个简洁而全面的指南，以减轻那些踏上AI会议论文写作之旅的读者的学习曲线。如果本文能成为读者的明灯，我们将视我们的努力为成功并满足了我们的目标。

附录

AI 论文制作与发表

本节主要介绍论文制作和审查流程。会议论文通常采用两栏排版，篇幅约八页，或单栏排版超十页，具体取决于会议要求。作者在规定的截止日期前准备并提交论文以及补充材料，如代码和演示视频。

若没有明显的疏忽，例如未匿名化提交、严重格式错误或超过页数限制——这些都可能导致直接拒稿（称为“桌面拒稿”），论文将进入审查阶段。大约两个月后，作者会收到来自三位审稿人的反馈，包括评论和对论文的总体评分。这些审稿人通常已在相关领域发表过论文，可能在提交的论文中被引用。根据初次审查结果，作者需要撰写一份简短的反驳意见，通常不超过一页，以回应问题或提供额外发现。在此反驳阶段，大约一半的论文会被撤回。之后，审稿人会基于反驳意见在一到两周内（通常在一个私有平台上）讨论论文的优缺点，并表明他们的担忧是否得到缓解。通常，审稿人会就正面或负面的立场达成一致，偶尔由领域主席作出决定。

最终的接受结果需要再等待大约一个月，然后通过邮件系统公布。通常，论文的接受率在六分之一到四分之一之间。作者随后根据审稿人的反馈对论文进行修订，提交最终的定稿以供发表。然而，大多数论文会被拒稿并退还给作者。作者可以选择按照上述流程再次提交，或者决定停止继续这项工作。值得注意的是，大多数论文都会经历一个广泛的改进和修订过程，被形象地称为“斐波那契投稿法”。

最后几小时清单

搜索问号以检查 LaTeX 错误。
确保所有图表在正文中都有提及，且提及顺序与图表出现顺序一致。
图例应非常醒目。避免语法错误，建议使用句号。
将图表矢量化。
检查所有公式是否完整，在编辑过程中这些往往容易被忽略。
浏览所有小标题，统一大小写风格。
确认没有图表在正文页面之外。
检查匿名性；可能需要删除致谢。

常见的负面审查意见

我们列出了一些常见的负面审查意见及修改建议（以斜体表示）。

批评作者不专业：缺少重要参考文献；论文结构混乱；缺少一些关键要素，例如没有为视频相关研究提交补充视频结果；实验设置与之前的工作差异显著。参考最近论文的参考文献列表以填补空白，配置应保持一致。
质疑有效性：报告的结果不符合常识，不可信；夸大自己的成就或作出一些明显错误的论断；实验设置或论证存在漏洞。进行更多实验，完善表述，并努力做到严谨。
不尊重先前工作：没有引用最新成果，进行了低基准实验；过度贬低前人工作；将自己的工作与前人贡献混为一谈。更多地与现有工作进行对比，进行更多论文研究；如果你认为其他人做得不好，请提供证据。
缺乏创新性：叙述不够好，逻辑不清晰，或者大部分是已知知识；感觉工作是增量的，没有太大贡献。换句话说，效果不令人印象深刻。与同行讨论，突出优势。
论文呈现质量差：语法错误多，写作不佳，英文水平差；难以理解，缺乏细节。使用 AI 工具或 Grammarly 进行修改，并请朋友帮忙阅读。
对方法的分歧：不认可实验设计或不相信这条技术路线。进行更多实验，或在相关文献中引用类似的表述以支持你的论点，努力说服其他审稿人。

如果论文未被接受

审稿过程高度随机。但有一个黄金法则经得起时间和随机性的考验——写得差的论文会得到差评。句号。无论想法好，结果好，引用好，都没有用。写作至关重要——这有点讽刺，因为工程师是大学所有学科中写作训练最差的群体。你需要自律：为写作留出时间，深入思考写作，并一遍又一遍地写，直到它达到你认为的完美程度。（李飞飞）

许多论文在被拒绝后留在 arXiv 上，现在产生了巨大的影响。论文将在整个过程中得到显著改进。如果这个过程帮助你产生了一篇真正优秀的论文，你可以从中受益并为之骄傲多年。

https://arxiv.org/abs/1503.02531 https://arxiv.org/abs/1606.06160

引用

我们发现 arXiv 不接受这篇文章。如果你需要引用它，你可以使用以下格式。

@misc{WritingAIPaper2024,
    author = {Zhewei Huang and Xiaohan Ding},
    title = {Writing AI Conference Papers: A Handbook for Beginners},
    publisher = {GitHub},
    journal = {GitHub repository},
    howpublished = {\url{https://github.com/hzwer/WritingAIPaper}},
    year = {2024},
    month = {9},
}