【笔记】机器翻译学术论文写作方法和技巧(作者:清华大学 刘洋)

【笔记】机器翻译学术论文写作方法和技巧

清华大学 刘洋

1 论文发表流程

步骤举例
确定方向(影响重大)统计机器翻译
确定问题利用句法对长距离调序建模
确定思路(思路新颖)将树到串对泛化为树到串模板
确定方法(方法正确)规则抽取,搜索算法
实验验证(易于重现)数据集、基线系统、评价指标
撰写论文(表达清晰)投搞ACL

2 解决问题

  • 思维独立性
    • 先思考,再去查文献相互印证
  • 语言学意义
    • 具有语言学理论的支撑,符合语言学角度的直觉
  • 数学意义
    • 使用数学工具做形式化,不臆造数学公式
  • 简洁优美
    • 简单、干净、优美

3 审稿过程

“(审稿人)审稿时往往先看题目、摘要,扫一下introduction(知道你做什么),然后直接翻到最后找核心实验结果(做得好不好),然后基本确定录还是不录(也许只用5分钟!)。如果决定录,剩下就是写些赞美的话,指出些次要的小毛病。如果决定拒,下面的过程就是细看中间部分找理由拒了。”

为此,我们的观念应当有所转变:以作者为核心整理工作 => 以读者为核心阐述工作

4 全新全意为读者服务

  • 信息的呈现符合读者的认知惯性
    • 深入浅出,引人入胜,让读者快速找到想要的信息
  • 尽量降低读者的理解难度
    • 合理地综合使用信息元素:图 > 曲线 > 表 > 正文 > 公式
  • 尽量提高读者阅读时的愉悦感
    • 思想新颖、组织合理、逻辑严密、论证充分、文笔优美、排版美观

tip:降低信息理解难度是关键。

5 标题的写法

  • 用一句话概括所做的工作
  • 考虑搜索引擎的影响,包含关键词

6 摘要的写法

几句话概括所作的工作(用语要简单,让外行能看懂)

  • 问题是什么;
  • 我们做了什么;
  • 我们大概怎么做的;
  • 实验数据表明,我们做的挺不错!

traps

  • 力图把所有细节都说清楚;
  • 用很专业的术语来描述;
  • 出现数学符号。

8 介绍的写法

  • 比题目和摘要更进一步,用几段话说清工作内容;
  • 要点是充分论证所作工作的必要性和重要性,要让审稿人认同并迫不及待想往下看;
  • 行文逻辑严密,论证充分。

行文逻辑

  1. 说明问题是什么;
  2. 目前最好的工作面临什么挑战;
  3. 我们的方法能缓解上述挑战。

9 段落的写法

  • 每段都有论断性的中心句
  • 其余部分都是支撑句,围绕中心句展开论证,且论证要严密
    • 前人工作
    • 具体数据
  • 支撑句之间可分类组织(关联词 …)
  • 段位可以加上衔接句(适当的总结:Therefore, … )

tips:

  • 在首页放置一张图或表,让读者一目了然所做的工作;
  • 不要去写“This paper is organized as follow. Section 2 …”,而是直接列出自己的贡献。

读者对于信息元素的接受程度:图 > 表格 > 正文 > 公式 > 算法 > 证明

10 图和表的重要性

  • 图和表是论文的骨架,争取让读者按照顺序看就能理解论⽂的主要思想,不用通过看正文才能懂
    • ⼀般第⼀遍看,都会看图、找例子
    • 然后翻到后面找主要结果
    • 再从头看正⽂文
  • 把论文的元素放在最应该被放在的地方,符合读者的认知惯性,降低理解难度

11 直接列出自己的贡献

在这里插入图片描述

12 方法的写法

如何描述自己的方法

不要一上来就描述自己的工作,可以先介绍背景知识(往往就是baseline)

  • 有利于降低初学者或其他领域学者的理解难度
  • 有利于对introduction中的论文做更详细的解释
  • 有利于对比baseline和自己的方法

Running Example

  • 全篇统一使用一个running example,用来阐释自己的方法(甚至是baseline)
  • 围绕着running example,展开描述自己的工作
  • 审稿人能从running example中更舒服地了解自己的工作,读正文会花掉他/她更多时间
  • 看完running example,审稿人便能知道核心思想

方法描述的逻辑顺序

  • 首先给出running example
  • 然后利用running example,用通俗语言描述自己的想法
  • 形式化的描述

每个公式都有语言学意义,都来自自己的直觉和想法,直接告诉审稿人,不要让他去揣摩。

13实验的写法

实验设计

  • 公认的标准数据和state-of-the-art系统
  • 实验先辅后主
    • 辅助实验(开发集):参数的影响
    • 主实验(测试集):证明显著超过baseline
  • 必须有显著性检验
  • 不辞辛劳,做到极致

14如何写相关工作

Wrong

  • 没有引⽤用重要论⽂文(可以直接作为rejection的理由)
  • 简单的罗列和堆砌,缺乏深刻到位的评论
  • 通过批评乃⾄至攻击前⼈人⼯工作证明你的⼯工作的创新性

Right

  • 向审稿人显⽰示你对本领域具有全面深刻的把握
  • 通过与前人工作的对比凸显你的工作的创新性
  • 为读者梳理领域的发展脉络,获得全局的认识

15 附录的写作技巧

  • 并非必需,但是对于读者深⼊入理解你的工作有帮助,往往非常形式化
  • 恰当地使用附录能显著提升论文的可读性

16 写作常见问题

  • 句子过长
  • 经常使用被动句式+弱动词
  • 结构松散+口语化+缺乏力度
  • 不定冠词和定冠词的误用
  • 公式后面文字的缩进
    • 当公式后的文本与公式有关,则不缩进,否则缩进

在这里插入图片描述

  • 引用的写法

17 必须掌握的工具

  • LaTex: http://www.ctex.org/HomePage
  • Bibtex:自动生成参考文献列表
  • MetaPost:编程画矢量图

18 英文写作推荐书籍

在这里插入图片描述

19 时间管理和获得反馈

  • coarse-to-fine
    • 截稿前一个月开始写
    • 每隔两天改一次
  • 听取不同背景读者的反馈意见
    • 专家:专业意见
    • 非专家:发现信息壁垒
  • 写到极致,完成完美精致的艺术品

20 总结

  • 写论文本质是分享思想,呈现信息
  • 信息的呈现符合读者的认知惯性
  • 全心全意为读者服务,降低阅读难度,提⾼高愉悦感
  • 细节决定成败
  • 不要本末倒置:创新至上,技法为辅。
  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值