Gensim实战(一)

       作为自然语言处理爱好者,大家都应该听说过或使用过大名鼎鼎的Gensim吧,这个一款具备多种功能的神器,为了深入了解该工具的使用方法,本人将使用该工具进行一系列实战。

       该系列博客共分为以下几章:

      (一)Gensim简介及使用环境搭建

      (二)工具自带教程分析

      (三)实战演练案例之文档分类

      (四)后记

      一、Gensim简介及使用环境搭建

(1)简介

      Gensim的作者是Radim Řehůřek,一位来自阿拉伯世界的学者。这个作品源于其博士论文《SCALABILITY OF SEMANTIC ANALYSIS IN NATURAL LANGUAGE PROCESSING》,用兴趣的同学可以到谷歌学术上查找看看,这里就不在细说。给定一篇文档,Gensim可以产生一些列与该文档相似的文档集合,这也是作者将其命名为Gensim(gensim = “generate similar”)原因。另外Gensim在Github上地址为:https://github.com/piskvorky/gensim。

(2)Gensim可以做什么?

根据Gensim的官方API描述,Gensim提供如下函数: 

  • 1
    点赞
  • 7
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值