文章目录
【笔记】机器翻译学术论文写作方法和技巧
清华大学 刘洋
1 论文发表流程
步骤 | 举例 |
---|---|
确定方向(影响重大) | 统计机器翻译 |
确定问题 | 利用句法对长距离调序建模 |
确定思路(思路新颖) | 将树到串对泛化为树到串模板 |
确定方法(方法正确) | 规则抽取,搜索算法 |
实验验证(易于重现) | 数据集、基线系统、评价指标 |
撰写论文(表达清晰) | 投搞ACL |
2 解决问题
- 思维独立性
- 先思考,再去查文献相互印证
- 语言学意义
- 具有语言学理论的支撑,符合语言学角度的直觉
- 数学意义
- 使用数学工具做形式化,不臆造数学公式
- 简洁优美
- 简单、干净、优美
3 审稿过程
“(审稿人)审稿时往往先看题目、摘要,扫一下introduction(知道你做什么),然后直接翻到最后找核心实验结果(做得好不好),然后基本确定录还是不录(也许只用5分钟!)。如果决定录,剩下就是写些赞美的话,指出些次要的小毛病。如果决定拒,下面的过程就是细看中间部分找理由拒了。”
为此,我们的观念应当有所转变:以作者为核心整理工作 => 以读者为核心阐述工作
4 全新全意为读者服务
- 信息的呈现符合读者的认知惯性
- 深入浅出,引人入胜,让读者快速找到想要的信息
- 尽量降低读者的理解难度
- 合理地综合使用信息元素:图 > 曲线 > 表 > 正文 > 公式
- 尽量提高读者阅读时的愉悦感
- 思想新颖、组织合理、逻辑严密、论证充分、文笔优美、排版美观
tip:降低信息理解难度是关键。
5 标题的写法
- 用一句话概括所做的工作
- 考虑搜索引擎的影响,包含关键词
6 摘要的写法
几句话概括所作的工作(用语要简单,让外行能看懂)
- 问题是什么;
- 我们做了什么;
- 我们大概怎么做的;
- 实验数据表明,我们做的挺不错!
traps:
- 力图把所有细节都说清楚;
- 用很专业的术语来描述;
- 出现数学符号。
8 介绍的写法
- 比题目和摘要更进一步,用几段话说清工作内容;
- 要点是充分论证所作工作的必要性和重要性,要让审稿人认同并迫不及待想往下看;
- 行文逻辑严密,论证充分。
行文逻辑:
- 说明问题是什么;
- 目前最好的工作面临什么挑战;
- 我们的方法能缓解上述挑战。
9 段落的写法
- 每段都有论断性的中心句
- 其余部分都是支撑句,围绕中心句展开论证,且论证要严密
- 前人工作
- 具体数据
- 支撑句之间可分类组织(关联词 …)
- 段位可以加上衔接句(适当的总结:Therefore, … )
tips:
- 在首页放置一张图或表,让读者一目了然所做的工作;
- 不要去写“This paper is organized as follow. Section 2 …”,而是直接列出自己的贡献。
读者对于信息元素的接受程度:图 > 表格 > 正文 > 公式 > 算法 > 证明
10 图和表的重要性
- 图和表是论文的骨架,争取让读者按照顺序看就能理解论⽂的主要思想,不用通过看正文才能懂
- ⼀般第⼀遍看,都会看图、找例子
- 然后翻到后面找主要结果
- 再从头看正⽂文
- 把论文的元素放在最应该被放在的地方,符合读者的认知惯性,降低理解难度
11 直接列出自己的贡献
12 方法的写法
如何描述自己的方法:
不要一上来就描述自己的工作,可以先介绍背景知识(往往就是baseline)
- 有利于降低初学者或其他领域学者的理解难度
- 有利于对introduction中的论文做更详细的解释
- 有利于对比baseline和自己的方法
Running Example:
- 全篇统一使用一个running example,用来阐释自己的方法(甚至是baseline)
- 围绕着running example,展开描述自己的工作
- 审稿人能从running example中更舒服地了解自己的工作,读正文会花掉他/她更多时间
- 看完running example,审稿人便能知道核心思想
方法描述的逻辑顺序:
- 首先给出running example
- 然后利用running example,用通俗语言描述自己的想法
- 形式化的描述
每个公式都有语言学意义,都来自自己的直觉和想法,直接告诉审稿人,不要让他去揣摩。
13实验的写法
实验设计:
- 公认的标准数据和state-of-the-art系统
- 实验先辅后主
- 辅助实验(开发集):参数的影响
- 主实验(测试集):证明显著超过baseline
- 必须有显著性检验
- 不辞辛劳,做到极致
14如何写相关工作
Wrong:
- 没有引⽤用重要论⽂文(可以直接作为rejection的理由)
- 简单的罗列和堆砌,缺乏深刻到位的评论
- 通过批评乃⾄至攻击前⼈人⼯工作证明你的⼯工作的创新性
Right:
- 向审稿人显⽰示你对本领域具有全面深刻的把握
- 通过与前人工作的对比凸显你的工作的创新性
- 为读者梳理领域的发展脉络,获得全局的认识
15 附录的写作技巧
- 并非必需,但是对于读者深⼊入理解你的工作有帮助,往往非常形式化
- 恰当地使用附录能显著提升论文的可读性
16 写作常见问题
- 句子过长
- 经常使用被动句式+弱动词
- 结构松散+口语化+缺乏力度
- 不定冠词和定冠词的误用
- 公式后面文字的缩进
- 当公式后的文本与公式有关,则不缩进,否则缩进
- 引用的写法
17 必须掌握的工具
- LaTex: http://www.ctex.org/HomePage
- Bibtex:自动生成参考文献列表
- MetaPost:编程画矢量图
18 英文写作推荐书籍
19 时间管理和获得反馈
- coarse-to-fine
- 截稿前一个月开始写
- 每隔两天改一次
- 听取不同背景读者的反馈意见
- 专家:专业意见
- 非专家:发现信息壁垒
- 写到极致,完成完美精致的艺术品
20 总结
- 写论文本质是分享思想,呈现信息
- 信息的呈现符合读者的认知惯性
- 全心全意为读者服务,降低阅读难度,提⾼高愉悦感
- 细节决定成败
- 不要本末倒置:创新至上,技法为辅。