自然语言处理
jrymos001
加油
展开
-
gensim 之 word2vec
gensim库三大功能: 可扩展的统计语义分析语义结构的纯文本检索语义上类似的文档word2vec是gensim的一个子模块,可以用来实现上面三大功能word2vec的理解下面的两篇博客对word2vec介绍的很详细 https://www.zhihu.com/question/25269336 http://www.cnblogs.com/iloveai/p/word2vec.html原创 2017-06-28 18:19:40 · 4264 阅读 · 1 评论 -
keras 之 0基础上手
官方教程: https://keras.io/1.快速开始:30s上手KerasKeras的核心数据结构是“模型”,模型是一种组织网络层的方式。Keras中主要的模型是Sequential模型,Sequential是一系列网络层按顺序构成的栈。你也可以查看函数式模型来学习建立更复杂的模型 #Sequential模型如下from keras.models import Sequentialmo原创 2017-06-29 12:03:31 · 1623 阅读 · 0 评论 -
gensim 之 td-idf和lsi模型
gensim官方文档: http://radimrehurek.com/gensim/tut2.htmlgensim可以将语料库转换为td-idf和lsi模型 td-idf模型上文已介绍: http://blog.csdn.net/m0_37681914/article/details/73781494gensim的LSI模型训练建立在td-idf之上,用来解决潜在语义,详情可以参考 htt原创 2017-06-27 18:06:51 · 6582 阅读 · 0 评论 -
td-idf的理解
何为TF-IDFTF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。假设有如下一篇文档集文档1: Human machine文档2: System human---------------------------------则有语料库(各个词在文档出现次数)原创 2017-06-27 12:36:51 · 3883 阅读 · 0 评论 -
gensim 之 相似性查询
官方文档: http://radimrehurek.com/gensim/tut3.html现实中常有需求,检索一条信息, 展示结果则取决于与该条信息相似性高低.使用gensim求检索信息与文档集相似度检索信息:Human computer interaction有以下文档集(每一行代表一个文档):Human machine interface for lab abc computer appli原创 2017-06-28 11:02:16 · 774 阅读 · 0 评论