word2vec生成词向量

最新推荐文章于 2023-06-02 15:56:04 发布

碎碎碎发发

最新推荐文章于 2023-06-02 15:56:04 发布

阅读量1k

点赞数 1

文章标签： word2vec 自然语言处理深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42937719/article/details/122395284

版权

先预处理，进行分词等

import jieba
from gensim.models import Word2Vec
stopword = [line.strip() for line in open('password.txt', 'r',encoding='utf-8').readlines()]
def seg_sentence(sentence):
    """"进行分词"""
    sentence_seged = jieba.cut(sentence.strip())  #分词
    stopwords = [' ']
    # # stopwords = stopwordslist('E:\\pythonimg\\stopword.txt')  # 这里加载停用词的路径  这里可以再加自定义的停用词
    outstr = ''   # 必须字符，不能列表
    for word in sentence_seged:
        if word not in stopwords:
            if word != '\t':
                outstr += word
                outstr += " "
    # return outstr
    return outstr.split(' ')  # 以空格分割 列表

生成词向量

def vec_produce(sentence,word,size):
    """生成词向量"""
    sentenceseg = seg_sentence(sentence) # 已分词可向量化的句子
    model = Word2Vec(sentences=[sentenceseg], vector_size=size, window=5, min_count=1, workers=4)
    word_vectors = model.wv
    wordvec = word_vectors[word]
    return wordvec

碎碎碎发发

关注

1
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
word2vec生成词向量

先预处理，进行分词等import jiebafrom gensim.models import Word2Vecstopword = [line.strip() for line in open('password.txt', 'r',encoding='utf-8').readlines()]def seg_sentence(sentence): """"进行分词""" sentence_seged = jieba.cut(sentence.strip()) #分词
复制链接

扫一扫

碎碎碎发发 CSDN认证博客专家 CSDN认证企业博客

码龄6年

19: 原创

114万+: 周排名

14万+: 总排名

1万+: 访问

: 等级

219: 积分

6: 粉丝

15: 获赞

8: 评论

25: 收藏

私信

关注

热门文章

最新评论

矩阵行复制python实现
CSDN-Ada助手: 恭喜您发布了新的博客！能够使用Python实现矩阵行复制这样的功能，展现了您对编程的深厚功底。希望您能够继续保持创作的热情，不断分享您的技术经验和心得体会。或许下一步可以考虑分享一些实际项目中的应用案例，或者是一些高级技巧的讲解，让读者能够更深入地了解相关知识。期待您更多精彩的文章！
c++学习笔记（1）基础
CSDN-Ada助手: 恭喜您写了第9篇博客！看到你的标题，我想你一定是一个勤奋的学习者。希望你继续保持学习的热情并坚持不懈地写作。下一步建议可以考虑深入一些高级C++知识，或者结合实际项目经验分享一些经验心得。再次祝贺你！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply9 看奖励名单。
c++学习笔记（2）数组，函数，指针，结构体
CSDN-Ada助手: 非常感谢您的分享，这篇博客让我对c++的数组、函数、指针和结构体有了更深入的了解。恭喜您已经写了10篇博客，您的学习笔记对其他学习者也一定有很大的帮助。接下来，我建议您可以考虑写一些实践性的文章，例如如何在实际项目中应用这些知识点，让读者更能够深入理解和掌握c++编程。期待您的下一篇作品！ CSDN 会根据你创作的博客的质量，给予优秀的博主博客红包奖励。请关注 https://bbs.csdn.net/forums/csdnnews?typeId=116148&utm_source=csdn_ai_ada_blog_reply10 看奖励名单。
word2vec生成词向量
碎碎碎发发: word是序号，表示是当前句子的第几个词
从neo4j中导出数据
晨辰晨c: desktop版本有导出json

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。