GloVe 教程之实战入门+python gensim 词向量

本文介绍了如何使用GloVe进行词向量训练,通过C代码进行预处理,然后利用Python的gensim库加载和使用训练结果。详细展示了从下载GloVe代码到生成词向量文本,再到将文本转换为gensim可读格式的全过程。
摘要由CSDN通过智能技术生成
前几天看论文,忽然看到了一个跟word2vec并列的词向量工具,这么厉害?还能跟word2vec相提并论?

果断需要试试。

GloVe 

它来自斯坦福的一篇论文,GloVe全称应该是  Global  Vectors for Word Representation


大概长这样,上面还有训练好的模型可以下载



下面开始动手。

官方的代码的GitHub在此 :  https://github.com/stanfordnlp/GloVe



可以看到,这是个c的版本,并且跑在linux下。

毕竟最爱的是python,首先想,有没有python版本的,GitHub上其实还真搜到了一个,不过看了一下,应该是哪个小伙伴自己写的,试了一下,发现一百句话的语料它的速度就已经慢得不能忍受了。我们是要面对至少几百M几个G的语料,显然这个是不能接受的。所以就不放链接了。

  • 15
    点赞
  • 102
    收藏
    觉得还不错? 一键收藏
  • 8
    评论
评论 8
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值