- 博客(11)
- 资源 (8)
- 收藏
- 关注
原创 词向量之加载word2vec和glove
1 Google用word2vec预训练了300维的新闻语料的词向量googlenews-vecctors-negative300.bin,解压后3.39个G。可以用gensim加载进来,但是需要内存足够大。#加载Google训练的词向量import gensimmodel = gensim.models.KeyedVectors.load_word2vec_format('G
2017-04-26 20:57:33 30040 5
原创 python kmp算法简单实现
def getnext(a,next): al = len(a) next[0] = -1 k = -1 j = 0 while j < al-1: if k == -1 or a[j] == a[k]: j += 1 k += 1 next[j] = k
2017-04-26 10:21:21 1971
原创 bp算法推导过程
bp算法的推导过程,留个纪念。参考http://deeplearning.stanford.edu/wiki/index.php/反向传导算法
2017-04-19 17:47:27 1221
原创 条件熵的定义
最大熵模型中使用条件熵作为模型基础,决策树算法中利用经验条件熵作为计算信息增益的基础。当熵和条件熵中的概率由数据估计(特别是极大似然估计)得到时,所对应的熵和条件熵分别成为经验熵和经验条件熵。维基百科中也有对条件熵的定义和相关公式的描述。李航统计学习方法中最大熵模型的定义为:决策树求信息增益时的经验条件熵的定义为:可以看得出条件熵和经验条件熵公式是一样的,只是概
2017-04-18 09:31:34 8632
原创 Elasticsearch入门1
Elasticsearch是一个实时 分布式搜索和分析引擎,用于全文搜索、结构化搜索、分析以及这三者混合使用。检索文档
2017-04-12 09:39:06 288
原创 tensorflow入门5 从一个二分类问题看rnn的结构
之前在笔记本上安上了tensorflow1.0版本,可以在本地运行tf的程序。今天看了一个rnn的例子,关于线性和非线性序列的分类问题。对于一个list,如果形如[1,2,3,4,5]这种有序的就说是分为class 0,[1,3,10,7]这种随机生成的序列就分为class 1。通过这个例子,对rnn的理解更明确了。还有一点就是tf1.0版本和之前的一些函数有所区别。代码解析如下:生成
2017-04-05 18:49:48 8098 1
nlp-lang-1.7.jar
2017-09-04
tree_split-1.5
2017-09-04
ansj_seg-5.1.3.jar
2017-09-04
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人