![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
NLP
coding-v
这个作者很懒,什么都没留下…
展开
-
Doc2Vec,Word2Vec文本相似度 初体验。
参考资料 : https://radimrehurek.com/gensim/models/word2vec.html 接上篇 : import jieba all_list = jieba.cut(xl['工作内容'][0:6],cut_all=True) print(all_list) every_one = xl['工作内容'].apply(lambda x:jieba.cut(x)) i...原创 2018-05-29 17:27:47 · 462 阅读 · 0 评论 -
jieba分词以及word2vec词语相似度
去除 标点符号, 下一步 开始文本相似度计算: 参考文章 : http://www.jb51.net/article/139690.htm from gensim.models import Word2Vec model = Word2Vec(sentences, sg=1, size=100, window=5, min_count=5, negative=3, sample=0.0...原创 2018-05-28 17:50:18 · 471 阅读 · 0 评论