上一篇我们学习了 BERT 的原理,这里我们将它应用在 NER 实战上,我们在前面课程中也学习过 NER,这里我们用同样的数据集来看如何应用 BERT,大家可以与前面的模型进行比较。
另外推荐大家使用 Google 的云端 Jupyter Notebook 开发环境 Colab,自带 TensorFlow、Matplotlib、NumPy、Pandas 等深度学习基础库,还可以免费使用 GPU、TPU。
下面进入实战,本文所用的数据仍然是 Kaggle 上的一个 NER 数据集,可以将其中的ner_dataset.csv 下载到本地。
加载所需的库
首先我们需要安装 transformers,里面包括 NLP 中比较前沿的模型:BERT、GPT、XLNet 等等,支持 TensorFlow 和 PyTorch。
!pip install transformers
!pip install seqeval
import pandas as pd
import numpy as np
from tqdm import tqdm, trange
import torch
from torch.utils.data i