自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(11)
  • 资源 (8)
  • 收藏
  • 关注

原创 词向量之加载word2vec和glove

1 Google用word2vec预训练了300维的新闻语料的词向量googlenews-vecctors-negative300.bin,解压后3.39个G。可以用gensim加载进来,但是需要内存足够大。#加载Google训练的词向量import gensimmodel = gensim.models.KeyedVectors.load_word2vec_format('G

2017-04-26 20:57:33 30040 5

原创 词向量之word2vec(2)

word2vec简单应用

2017-04-26 10:36:09 725

转载 词向量之word2vec(1)

word2vector

2017-04-26 10:35:09 630

原创 python kmp算法简单实现

def getnext(a,next): al = len(a) next[0] = -1 k = -1 j = 0 while j < al-1: if k == -1 or a[j] == a[k]: j += 1 k += 1 next[j] = k

2017-04-26 10:21:21 1971

原创 bp算法推导过程

bp算法的推导过程,留个纪念。参考http://deeplearning.stanford.edu/wiki/index.php/反向传导算法

2017-04-19 17:47:27 1221

原创 重启随机游走算法(RWR)

重启随机游走算法(RWR)

2017-04-18 10:46:55 32156 5

原创 条件熵的定义

最大熵模型中使用条件熵作为模型基础,决策树算法中利用经验条件熵作为计算信息增益的基础。当熵和条件熵中的概率由数据估计(特别是极大似然估计)得到时,所对应的熵和条件熵分别成为经验熵和经验条件熵。维基百科中也有对条件熵的定义和相关公式的描述。李航统计学习方法中最大熵模型的定义为:决策树求信息增益时的经验条件熵的定义为:可以看得出条件熵和经验条件熵公式是一样的,只是概

2017-04-18 09:31:34 8632

原创 python快排

快排最少的时间复杂度是O(n),平均是O(n logn),最坏O(n^2)。#quick_sort

2017-04-17 09:16:01 1836

原创 Elasticsearch入门1

Elasticsearch是一个实时 分布式搜索和分析引擎,用于全文搜索、结构化搜索、分析以及这三者混合使用。检索文档

2017-04-12 09:39:06 288

原创 tensorflow入门6 tensorboard的使用

tensorboard的基本内容tensorboard的使用例子

2017-04-09 22:46:35 1019

原创 tensorflow入门5 从一个二分类问题看rnn的结构

之前在笔记本上安上了tensorflow1.0版本,可以在本地运行tf的程序。今天看了一个rnn的例子,关于线性和非线性序列的分类问题。对于一个list,如果形如[1,2,3,4,5]这种有序的就说是分为class 0,[1,3,10,7]这种随机生成的序列就分为class 1。通过这个例子,对rnn的理解更明确了。还有一点就是tf1.0版本和之前的一些函数有所区别。代码解析如下:生成

2017-04-05 18:49:48 8098 1

nlp-lang-1.7.jar

ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。

2017-09-04

tree_split-1.5

ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。

2017-09-04

ansj_seg-5.1.3.jar

最新的ansj分词工具jar包,用于在ecplise中使用ansj分词。ansj是由孙健开发的一个基于n-Gram+CRF+HMM的中文分词的java实现。分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。目前实现了:中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。作者在最新的分词方式里增加了基于深度学习的分词方式。

2017-09-04

rnn梯度计算过程

介绍RNN中参数梯度公式推导

2017-06-08

2014全国大学生数学建模a题

2014年全国大学生数学建模A题,有关嫦娥三号登月软着陆的文章,对题目有详细的描述。

2014-09-17

霍夫变换对视频中圆的识别

opencv中通过霍夫变换实现摄像头中圆形物体的识别和跟踪

2014-08-14

基于轮廓寻找的视频流运动检测

通过c++中的opencv实现对运动物体的轮廓检测

2014-08-07

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除