🎉进入深度神经网络与PyTorch进阶专栏 | 🚀查看更多专栏内容
数据集准备
从bert-base-chinese下载预训练语言模型及其他词表,由于使用的是pytorch,因此下载pytorch_model.bin
即可。
如果要使用英文模型,就下载能区分大小写的或者是不能区分大小写的,对于uncased,初始化时必须要把lower设为true。
特殊符号
BERT在执行分词任务时会生成以下几种特殊符号:
🎉进入深度神经网络与PyTorch进阶专栏 | 🚀查看更多专栏内容
从bert-base-chinese下载预训练语言模型及其他词表,由于使用的是pytorch,因此下载pytorch_model.bin
即可。
如果要使用英文模型,就下载能区分大小写的或者是不能区分大小写的,对于uncased,初始化时必须要把lower设为true。
BERT在执行分词任务时会生成以下几种特殊符号: