机器学习
jrymos001
加油
展开
-
gensim 之 word2vec
gensim库三大功能: 可扩展的统计语义分析语义结构的纯文本检索语义上类似的文档word2vec是gensim的一个子模块,可以用来实现上面三大功能word2vec的理解下面的两篇博客对word2vec介绍的很详细 https://www.zhihu.com/question/25269336 http://www.cnblogs.com/iloveai/p/word2vec.html原创 2017-06-28 18:19:40 · 4281 阅读 · 1 评论 -
td-idf的理解
何为TF-IDFTF-IDF是一种统计方法,用以评估一字词对于一个文件集或一个语料库中的其中一份文件的重要程度。字词的重要性随着它在文件中出现的次数成正比增加,但同时会随着它在语料库中出现的频率成反比下降。假设有如下一篇文档集文档1: Human machine文档2: System human---------------------------------则有语料库(各个词在文档出现次数)原创 2017-06-27 12:36:51 · 4029 阅读 · 0 评论 -
gensim 之 td-idf和lsi模型
gensim官方文档: http://radimrehurek.com/gensim/tut2.htmlgensim可以将语料库转换为td-idf和lsi模型 td-idf模型上文已介绍: http://blog.csdn.net/m0_37681914/article/details/73781494gensim的LSI模型训练建立在td-idf之上,用来解决潜在语义,详情可以参考 htt原创 2017-06-27 18:06:51 · 6647 阅读 · 0 评论 -
gensim 之 语料库和矢量空间
官方文档: http://radimrehurek.com/gensim/tutorial.html#first-example 语料库: 可以很接近词库,但并非词库,用来表示文档集的矩阵 矢量空间: 可以理解为用来描述一个文档的向量 比如: 词库为: fly sky moon (位置顺序为0 1 2)文档集为: I fly in the sky,will fly to原创 2017-06-26 21:52:52 · 907 阅读 · 0 评论 -
python数据分析工具学习安装配置简介
Python本身的数据分析本身的数据分析功能并不强,需要安装一些第三方扩展库来增强它的能力. 目前主流的有以下部分:Numpy 提供数组支持,高效的处理函数https://docs.scipy.org/doc/numpy-dev/user/Scipy 提供矩阵支持,矩阵相关的计算模块http://scipy.github.io/devdocs/Matplotlib 数据可视化原创 2017-06-26 20:39:38 · 440 阅读 · 0 评论 -
机器学习 之 keras
摘自keras中文文档: http://keras-cn.readthedocs.io/en/latest/for_beginners/concepts/#_5对新手友好的小说明虽然这不是我们应该做的工作,但为了体现本教程对新手的友好,我们在这里简单列一下使用keras需要的先行知识。稍有经验的研究者或开发者请忽略本节,对于新手,我们建议在开始之前,确保你了解下面提到的术语的基本概念。如果你确实对原创 2017-06-23 12:27:20 · 1146 阅读 · 0 评论 -
Windows搭建安装keras
搭建keras,先得搭建theano和TensorFlow 1.难就难在搭建theano,我花了大半天的时间,终于吧theano弄好了: http://blog.csdn.net/m0_37681914/article/details/73609177 接下来,TensorFlow和keras很简单了: 2.cmd输入命令,安装TensorFlowpip install tensorflow原创 2017-06-22 17:58:27 · 19298 阅读 · 3 评论 -
Windows安装配置theano,Python3.6
整个过程可以用欲哭无泪来形容了. 我已经记不起失败过多少次了. 中间来来回回安装卸载,安装卸载.最后一次成功的所有步骤如下: 1.清理机器: 卸载Python,清除Python的环境变量 2.下载anaconda: https://www.continuum.io/downloads#windows 3.安装anaconda: 把Python和path,两个选择项都勾上,因为anaco原创 2017-06-22 17:49:15 · 14934 阅读 · 2 评论 -
keras 之 0基础上手
官方教程: https://keras.io/1.快速开始:30s上手KerasKeras的核心数据结构是“模型”,模型是一种组织网络层的方式。Keras中主要的模型是Sequential模型,Sequential是一系列网络层按顺序构成的栈。你也可以查看函数式模型来学习建立更复杂的模型 #Sequential模型如下from keras.models import Sequentialmo原创 2017-06-29 12:03:31 · 1635 阅读 · 0 评论 -
gensim 之 相似性查询
官方文档: http://radimrehurek.com/gensim/tut3.html现实中常有需求,检索一条信息, 展示结果则取决于与该条信息相似性高低.使用gensim求检索信息与文档集相似度检索信息:Human computer interaction有以下文档集(每一行代表一个文档):Human machine interface for lab abc computer appli原创 2017-06-28 11:02:16 · 787 阅读 · 0 评论