BERT其中的一个重要作用是可以生成词向量
下面介绍获取词向量的方法
获取BERT词向量的时候用到了肖涵博士的bert-as-service,具体使用方式如下。
环境要求:python版本>=3.5,tensorflow版本>=1.10
相关包的安装:
pip install bert-serving-server
pip install bert-serving-client
下载训练好的BERT中文模型:https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip
启动bert-as-service :
在cmd窗口进入bert-serving-start.exe所在的文件夹(一般这个文件在python安装路径下的Scripts文件夹下),
在该文件路径下输入 bert-serving-start -model_dir C:\Users\admin\Desktop\text_cf\chinese_L-12_H-768_A-12
测试一下
from bert_serving.client import BertClient
b