bert使用

本文详细介绍了如何在Python环境中安装BERT模型,包括安装Tensorflow和BERT相关包,注意Tensorflow版本要求。还讲述了如何下载预训练模型并启动BERT服务。在使用中,通过BertClient获取词向量,展示了BERT编码句子的示例。强调了使用BERT时的注意事项,如避免在循环中使用,并给出了输出词向量的维度和示例。
摘要由CSDN通过智能技术生成

bert安装:
首先安装tensorflow,然后安装bert的包
这里好像有个坑是bert适用的tensorflow版本要小于2,但是直接安装的话应该是比较新的tensorflow版本,所以最好安装的时候注意一下。

pip install tensorflow
pip install bert-serving-server
pip install bert-serving-client
#镜像安装:pip install bert-serving-server -i https://pypi.tuna.tsinghua.edu.cn/simple/

然后下载bert预训练的模型:
地址:https://github.com/google-research/bert#pre-trained-models
在这里插入图片描述
在这里自行选择合适的包。
在使用bert的时候要在命令行一直运行:

bert-serving-start -pooling_strategy NONE -model_dir g:/chinese_L-12_H-768_A-12 -num_worker=1 -max_seq_len=100

-pooling_strategy NONE如果加这个参数的话,表明输出的是词向量,如果不加,输出就是句向量。-model_dir是之前安装的预训练模型的位置,-max_seq_len=100表明单次处理句子的最大长度是100.

一直等到出现:
在这里插入图片描述
说明可以开始使用了。
一个例子:

from bert_serving.client import BertClient
bc = BertClient(ip='localhost',check_version=False, check_length=False)
vec = bc.encode(['中文知识服务集团,业务有信息传播、技术交流、教育培训和专业技术人才服务。旗下有网络社区、学习平台和交流平台。'])
# print(vec)
# print(type(vec))
print(vec.shape)
print(vec[0][55])
print(len('中文知识服务集团,业务有信息传播、技术交流、教育培训和专业技术人才服务。旗下有网络社区、学习平台和交流平台。'))
##output
#(1, 100, 768)
#[-4.98340614e-02 -2.98149362e-02  4.43814732e-02  1.57387182e-02...]
#54

vec[0][55]中的0表示当前list中的第0个句子,55表示文本中的第54个词向量。
使用bert进行预训练的时候要输入一批句子,千万不要把bert用在循环里。
这样得到的每个句子对应的词向量的维度就是字数*768了。
然后进行下一步任务吧!!!

参考地址:
https://blog.csdn.net/renyuanfang/article/details/86701148

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值