shell script 写json文件_AllenNLP之config.json文件如何写?

本文详细介绍了AllenNLP框架中config.json的格式要求,包括配置参数、json书写规则以及关键模块的配置示例,如LSTM、初始化模块和迭代器。强调了train_data_path的必要性,以及如何配置已有的词汇表和额外的encoder层。对于初学者,这是一份实用的配置指南。
摘要由CSDN通过智能技术生成

使用AllenNLP的童鞋一定很头疼一件事情,那就是config.json的格式应该如何去书写。我们总是不经意间会多加一行或者少一个逗号,这样在解json文件或者初始化我们的模型都会遇到bug。

这里就总结一下,json文件书写的格式,希望对大家有所帮助。

首先,我们应该知道我们能够配置的参数有哪些?下图将会告诉大家我们可以配置的参数~

0f0294fb1213c34a035aae5aac390256.png
这些时可以配置的参数

8fe732e7d64612f8528396d0fbce9a45.png
这个是我们最外层的json形式,虽与上图并不是一一对应的关系,但是只是层级不一样罢了。

b81ce3b922e04e587ab09b1e656f1f44.png
type必不可少,token_indexer里的namespace命名要与后面的embedder相对应,这样才能正确的look up

09d9c205b2e7e1ce9de9aa4105fc95a2.png
三个路径中,除了train_data_path是必选,其他皆可选。但是test_data_path 要求也必须是有标签才行!!!!!!!

59aadd580aa5c12c96e8422a80ac5eed.png
vocabulary是可选的,如果你之前已经建立好词表,则可以直接配置,allennlp就不会重新遍历训练集再去生成一遍词表。

98888bb38110c80154f4689ca1b55dc4.png
token_characters 里面可以配置encoder,表示在embedding层后面再添加一层encoder

至于常用的module,这里列举几个:

b0ef49e2131ca555859d2e89238c5bd2.png
配置LSTM

a5e2d1684ad3608f2ea1d90a016c8346.png
配置全连接

afd71a7d70ef0bc2682f8afae9ec9f5f.png
初始化模块的配置方式,使用正则匹配

8365644c164f452f60c28ba0ecaa3c17.png
对哪些层添加正则约束的意思,同样是使用正则匹配

272ade32450c30826eb9a19272b23116.png
iterator迭代器的配置,这里可以配置batchsize的大小

54c9f098ecc0baf325ad11c304152531.png
训练相关参数的配置,注意cuda_device是使用GPU的列表

64d99fc8898fcfd299a54ab57d3b594d.png
EMA的配置

感觉常用的配置就这些,如果大家对其他配置感兴趣可以留言或私信,我看看我会不会,会的话再补上~

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值