文本向量—使用bert预训练模型获取中文的词向量

使用了肖涵博士的bert-as-service,详情请参考https://github.com/hanxiao/bert-as-service

1、使用的环境python=3.6,tensorflow=1.13.2,tensorflow版本不能太高,2.x不支持bert-as-service。
安装需要的包:

pip install bert-serving-server
pip install bert-serving-client

2、同时还需要下载训练好的Bert中文模型:https://storage.googleapis.com/bert_models/2018_11_03/chinese_L-12_H-768_A-12.zip
3、然后在终端命令进入bert-serving-start.exe所在的文件夹,这个一般在python安装路径下的Scripts文件夹下,因为我使用的是anaconda的python,所以我的在/home/usrsvc/anaconda3/envs/bertVector/bin这个文件夹下。
4、命令行启动bert-as-service:
在这里插入图片描述

bert-serving-start -model_dir /data/bert_chinese_pretrainmodel/chinese_L-12_H-768_A-12 -num_worker=2 > /data/userhome/leijin/log/bert-log/bert.log

(下载好的中文模型路径,num_worker的数量可以自行选择)
最后,在pycharm编写如下代码:

from bert_serving.client import BertClient
bc = BertClient()
print(bc.encode(['北京'],['上海']))

这样就可以获取到词向量了!

评论 11
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值