(pytorch) bert-base-chinese模型文件下载

用的是transformers,进入 hugging face 的这个网站:bert-base-chinese · Hugging Face

在 Files and Versions 中对应下载或另存为(有的下完要重命名一下)

所需要的就是 config.json,   pytorch_model.bin, vocab.txt 这几个文件

建立了如下文件夹路径来存放这些文件

└─bert
    │  vocab.txt
    │  
    └─bert-base-chinese
            config.json
            pytorch_model.bin

from transformers import BertTokenizer

vocab_file = 'bert/vocab.txt'

tokenizer = BertTokenizer(vocab_file)
from transformers.modeling_bert import BertModel

bert = BertModel.from_pretrained("bert/bert-base-chinese/")

此处用的 transformers的版本是3.2.0

往下具体再怎么使用,可以去github找一些具体任务,

如文本分类之类的项目代码,看处理步骤。

放一个我以前跟着做的法研杯的一个任务,有基线代码

学会使用pytorch的bert也是从这个基线代码学到的,不过单机多卡的分布式训练还没搞懂:

CAIL2020-Argument-Mining/model.py at master · gaoyixu/CAIL2020-Argument-Mining · GitHubhttps://github.com/gaoyixu/CAIL2020-Argument-Mining/blob/master/model.py#L28

CAIL2020-Argument-Mining/data.py at master · gaoyixu/CAIL2020-Argument-Mining · GitHubhttps://github.com/gaoyixu/CAIL2020-Argument-Mining/blob/master/data.py#L117

评论 6
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值