利用paddle提供的word2vec模型进行word embedding操作

最新推荐文章于 2023-03-27 18:37:14 发布

xiaoxiaoqian0519

最新推荐文章于 2023-03-27 18:37:14 发布

阅读量990

点赞数

文章标签：自然语言处理

本文链接：https://blog.csdn.net/xiaoxiaoqian0519/article/details/112825181

版权

安装

需求

paddlepaddle>=1.8.0
paddlehub>=1.8.0
pretrained word2vec_skipgram
ps：在网不好的情况下，可以预先下载下来，这样安装也比较方便；

demo

直接读取，进行word embedding；

import paddle.fluid as fluid
import paddlehub as hub
import time

raw_data = ["驾驶违章一次扣12分用两个驾驶证处理可以吗",             "一次性扣12分的违章,能用不满十二分的驾驶证扣分吗",
            "水果放冰箱里储存好吗", "中国银行纪念币网上怎么预约",
            "电脑反应很慢怎么办", "反应速度慢,电脑总是卡是怎么回事"]
max_seq_len = 512

module = hub.Module(name="word2vec_skipgram", version='1.1.0')
inputs, outputs, program = module.context(trainable=False, max_seq_len=max_seq_len)

word_ids = inputs["text"]
embedding = outputs["emb"]

tokenizer = hub.CustomTokenizer(vocab_file=module.get_vocab_path

最低0.47元/天解锁文章

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

xiaoxiaoqian0519

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
利用paddle提供的word2vec模型进行word embedding操作

安装需求paddlepaddle>=1.8.0paddlehub>=1.8.0pretrained word2vec_skipgramps：在网不好的情况下，可以预先下载下来，这样安装也比较方便；demo直接读取，进行word embedding；import paddle.fluid as fluidimport paddlehub as hubimport timeraw_data = ["驾驶违章一次扣12分用两个驾驶证处理可以吗",
复制链接

扫一扫