- 博客(2)
- 资源 (2)
- 收藏
- 关注
原创 gensim 实践篇
继上篇文章了解了一些模型的基本原理以后,这里来讲讲怎么用 gensim,主要参考官方网站的 gensim: Tutorials,这篇博文也只是简单记下一点笔记。主要有三块内容,先讲怎么把文档表示成向量空间模型(VSM,vector space model)中的稀疏向量(sparse vector)形式,然后是怎么用模型(这里叫 topic and transformations)把词袋模型(BoW,
2017-06-16 16:21:11 5284
原创 gensim 理论篇
gensimgensim 是 Radim Rehurek 写的一个用来处理文本相似度的 python 库。可以很方便的用 tfidf,LDA,LSA,word2vec 等模型,涵盖了 NLP 里常见的词袋模型,主题模型,词嵌入等。下面简单介绍一下这些概念。Vector Space model在自然语言处理中,我们经常需要表示一个文档。一种常见的做法是写成向量的形式,比如直接统计一下该文章的词频,那么
2017-06-15 17:35:06 2239
SSOAuth示例及源码
2014-08-29
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人