自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(6)
  • 收藏
  • 关注

原创 机器学习-1-朴素贝叶斯

- 引言朴素贝叶斯(naive Bayes)是基于贝叶斯订立和特征条件独立假设的分类方法;对于给定的训练集和,基于特征条件独立假设学习输入/输出的联合概率分布;然后基于此模型,对给定的输入x,利用贝叶斯订立求出后验概率最大的输出y; (朴素贝叶斯和贝叶斯估计(Bayesian estimation)是不同的概念。)- 基本方法朴素贝叶斯的方法是通过训练数据学习出联合条件概率分布P(X,Y)

2017-08-05 04:53:15 359

原创 提取灵格斯里ld2格式词典的内容

作为一个NLPer,拥有越多文本相关的资源当然越好,词典资源就是其中之一,面对灵格斯里面那么多的词典,怎么提取出其中的内容是个问题,之前在网上搜了一些相关的信息,最终找到一个java代码通过该代码可以直接将灵格斯里.ld2格式的词典内容提取出来,具体的做法应该是根据.ld2的词典格式进行分析,从而得到其中的内容,感谢“Copyright (c) 2010 Xiaoyun Zhu”和“@author

2017-04-04 21:32:34 10980 6

原创 stanford-segmenter的使用

对于中文的自然语言处理任务来说,分词似乎已经是第一步了,因为深度学习想要使用词向量的话,分词基本是第一步,除非我们基于单个中文单词,当然这看具体的模型了。所以我们需要一个好的分词工具,stanford-segmenter就是一个不错的分词工具,当然也有很多优秀的其他分词工具,具体用哪个看个人爱好,本文将介绍stanford-segmenter的使用。我使用的工具包是“stanford-segme

2017-04-04 21:07:46 2218

原创 stanford-postagger的使用

在自然语言处理的很多任务上,词性信息基本上已经是一个必不可少的特征信息,但是我们很多情况下又没有能力写一个postagger,这时我们就需要利用其他词性标注的工具包,而stanford-postagger就是一个很不错的工具包,这次我简要说一下stanford-postagger这个包。具体地,我用的版本是stanford-postagger-full-2015-04-20。由于该工具包是用jav

2017-04-04 20:48:39 3742

原创 使用theano写mini-batch训练的BiLSTM

mini batch, lstm, theano

2017-04-03 09:32:05 630

原创 第一篇~

在2016年的尾声,开通了自己的个人博客,希望博客能记录我平时生活,现在学习,将来工作的点点滴滴~明天就2017年了~希望自己在新的一年也能够取得更大的进步~

2016-12-31 23:08:51 200

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除