使用bert 快速进行词嵌入word2vec教程

最新推荐文章于 2024-06-25 09:31:58 发布

FulChou

最新推荐文章于 2024-06-25 09:31:58 发布

阅读量2.4k

点赞数 1

分类专栏：人工智能文章标签： word2vec 词嵌入 bert

本文链接：https://blog.csdn.net/qq_43213352/article/details/112547855

版权

人工智能专栏收录该内容

5 篇文章 0 订阅

订阅专栏

word2vec：

	就是将 一个词或者一个句子映射到一个高维空间，得到一组向量

最近遇到一个任务，需要对特定的语句key 去提取相应的 value：
比如从一个身份证 ocr 结果中，输入姓名得到对应人的名字
一想到这里，为了能够从姓名这个词组 box 得到人名 box 结果，除了从相对位置入手，词语之间的关联性也是一个入手点。

google 已经将预训练模型放出来在官方的github上面了，利用预训练模型，进行词嵌入是一件简单的事情：

下载预训练模型：链接：https://github.com/google-research/bert#pre-trained-models
我是用的是 BERT-Base, Chinese
解压
安装包：

pip install tensorflow-gpu==1.15
pip install -U bert-serving-server bert-serving-client

启动：

bert-serving-start -model_dir /path_to_the_model/ -num_worker=1

预测词嵌入：

from bert-serving.client import BertClient()
client = BertClient()
vectors = client.encode(['dog', 'cat','man'])

计算相似度：

from service.client import BertClient
import numpy as np
bc = BertClient()
def cosine(a,b):
    return a.dot(b)/(np.linalg.norm(a)*np.linalg.norm(b))
vectors=np.array(bc.encode(['First do it', 'then do it right']))
print(['First do it', 'then do it right'],":",cosine(vectors[0],vectors[1]))

结果：
['First do it', 'then do it right'] : 0.92645866

FulChou

关注

1
点赞
踩
14

收藏

觉得还不错? 一键收藏
1
评论
使用bert 快速进行词嵌入word2vec教程

word2vec：就是将一个词或者一个句子映射到一个高维空间，得到一组向量最近遇到一个任务，需要对特定的语句key 去提取相应的 value：比如从一个身份证 ocr 结果中，输入姓名得到对应人的名字一想到这里，为了能够从姓名这个词组 box 得到人名 box 结果，除了从相对位置入手，词语之间的关联性也是一个入手点。google 已经将预训练模型放出来在官方的github上面了，利用预训练模型，进行词嵌入是一件简单的事情：下载预训练模型：链接：https://g
复制链接

扫一扫