写给NLP研究者的编程指南

最近AllenNLP在EMNLP2018上做了一个主题分享,名为“写给NLP研究者的编程指南”(Writing Code for NLP Research)。

 

内容干货满满,仅仅只是看了slide就知道是非常有意思的一次演讲了。slide共有254页之多,这里我简单做个摘要,分享一些有意思的内容。

 

有时间的话推荐大家直接看slide,下面是地址,请自备梯子。

 

https://github.com/allenai/writing-code-for-nlp-research-emnlp2018/blob/master/writing_code_for_nlp_research.pdf

 

下面是整个分享的大纲。通过这次演讲,你可以学到如何写代码来促进你的研究,以及可复现的实验。

 

640?wx_fmt=jpeg

 

这里有两种写研究代码的模式,一种是写原型,一种是写组件。

 

640?wx_fmt=jpeg

 

我们先从写原型的方式开始介绍。

 

640?wx_fmt=jpeg

 

当我们开始写一个原型代码的时候,我们要做到下面三点。

 

  1. 写代码要快

  2. 跟踪实验结果

  3. 分析模型结果

 

快速开发

 

640?wx_fmt=jpeg

 

要做到快速编程,不要从头开始写所有内容,而是使用框架。这里的框架不仅指tensorflow或pytorch之类的框架,也可以理解为模板。比如上图中如果写trining loop的部分,已经有人写好了。我们只要看懂后,直接拿来用就行,没有必要从头开始自己写所有部分。

 

640?wx_fmt=jpeg

 

上面提到的一些内容,都是可以找到现成框架来套用的。

 

Don’t start from scratch! Use someone else’s components.

 

640?wx_fmt=jpeg

 

如果有人把你想用的东西模块化了,还等什么,直接拿来用啊!

 

640?wx_fmt=jpeg

 

要想快速开发,另一个建议就是先复制,再重构。要记住,我们是在写原型,不用在乎什么可用性,先把代码写work了再说。如果实现的效果不错的话,再回去重构。

 

640?wx_fmt=jpeg

 

另外,我们要有好的编程习惯。比如起有意义的变量名,写注释帮助理解。记住,我们是写给人看的,不是机器!

 

跟踪实验结果

 

640?wx_fmt=jpeg

 

可以准备一个Excel表格,来记录实验结果

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值