自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(10)
  • 资源 (6)
  • 收藏
  • 关注

原创 隐马尔科夫模型java实现

上周微信公众号推荐了一篇文章叫隐马尔科夫中文词的文章,原文http://blog.csdn.net/u014365862/article/details/54891582大概了看了下,讲的通俗易懂,这周还很忙,一直在做crf模型,周五比较闲,明天也五一,花了一下午的时间写了下代码实现隐马尔科夫模型,代码中最好是用对手的形式,hmm一旦长了,数字变小,会产生问题,我看了下hanlp的hmm分

2017-04-28 17:32:45 3457 1

原创 java实现文本分类中卡方特征选择

java在文本分类中卡方的特征选择, 在文本分类的特征选择阶段,一般使用“词汇t与类别c不相关”来做原假设,计算出的开方值越大,说明对原假设的偏离越大,我们越倾向于认为原假设的反面情况是正确的。选择的过程为每个词计算它与类别c的开方值,从大到小排个序(此时开方值越大越相关),取前k个就可以。所以卡方值越大,词汇与分类越相关。最后结果,一个特征对应一个最后的卡方值

2017-04-24 17:04:35 1913 3

原创 libsvm 中文文本分类 java版本

这周打算用word2vec+lstm做一个中文文本分类模型,无奈老大以前用过libsvm,叫我用libsvm,折腾了两天基本上调通中通碰到各种各样的问题,在此记录下来。首先下载libsvm包,下载链接http://www.csie.ntu.edu.tw/~cjlin/cgi-bin/libsvm.cgi?+http://www.csie.ntu.edu.tw/~cjlin/li

2017-04-21 19:54:46 14977 2

原创 deeplearning4j之GloVe实现实现

glove类似于word2vec,听说效果还比word2vec更加强大,可以用于做自然语言处理,正好学习deeplearning4j的时候看到了,顺便写在这,文章用到的数据跟上一篇word2vec一样,看看效果吧,训练时间比word2vec要长太多,代码如下:package com.meituan.deeplearning4j;import org.datavec.api.util.C

2017-04-17 19:46:59 1816 2

原创 deeplearning4j之卷积神经网络实现

卷积神经网络从跟普通的的机器学习模型并不大一样,输入一般为一个高维矩阵,能后经过卷积、池化、卷积、池化、、到全连接 、softmax、方向传播 调整权值,目前实现cnn的各种深度学习架构很多,下面用的deeplearning4j包实现,主要参考git上项目提供的例子,package com.meituan.deeplearning4j;import java.io.IOExce

2017-04-16 00:58:54 5233 5

原创 deeplearning4j之word2vec学习

在deeplearning4j下训练word2vec模型还是比较简单的,先看下依赖情况: UTF-8 0.7.1 0.7.1 0.7.1 2.10 org.nd4j nd4j-native ${nd4j.version} org.deeplearning4j deeplearning4j-core ${d

2017-04-14 17:55:14 5323 4

原创 deeplearing4j学习之矩阵学习

最近要学习deeplearning4j,先看了下矩阵情况学习,先看下创建矩阵的情况:package com.meituan.nd4jexcise;import java.util.Arrays;import org.nd4j.linalg.api.ndarray.INDArray;import org.nd4j.linalg.factory.Nd4j;public class Nd4j

2017-04-14 17:49:06 1519

原创 多项式朴素贝叶斯文本分类 java

今天可忙活了一天,从写朴素贝叶斯算法到模型存储,到测试数据模评估,具体来看看代码我用的数据,用ansj分词,去停顿词 ,最后的文本结构如下:(-1,技术 特别 特别 神奇 师傅 环境 特别 优雅 下次 再来)(-1,技师 按摩服务 专业 舒服 太爽啦)(-1,美女服务 明晚 光顾)(-1,服务态度)(-1,谢谢 好吃 嘎嘎嘎嘎)(-1,服务态度 菜品)(

2017-04-10 17:39:08 1309 1

原创 多项式和伯努利朴素贝叶斯文本分类模型 java实现

话说最近要写个文本分类的项目,然后嵌套到系统里面去,打算用spark,发现rdd并不好存储,自己写了个来实现吧,原理主要参考:http://blog.csdn.net/cxmscb/article/details/69267326http://blog.163.com/jiayouweijiewj@126/blog/static/1712321772010102802635243/

2017-04-10 13:39:57 1593

原创 spark中文文本分类

最近要做一个点评中文的文本分类模型,想在spark中训练模型,然后通过把tf过程、idf过程、以及模型封装到一个类里面一个java类中,然后写到redis中,但是spark中idf过程中碰到一些困难,忘高手赐教,先看下面代码:package com.meituan.spark.modelimport org.apache.log4j.{ Level, Logger }import

2017-04-01 15:01:44 2559 3

python tensorflow安装whl文件

tensorflow 在Windows下安装文件 只支持Python3.5 在Windows环境下

2017-02-22

Python xgboost windows下安装包(64位,Python3.5包)

python标准安装whl文件,下载下来直接用pip install xgboost-0.6-cp35-cp35m-win_amd64.whl 安装即可以。

2017-02-22

java数据挖掘源码

java实现常用的数据挖掘源码,很好的资料,有兴趣可以下载看看。

2015-10-28

python安装神器easy_install

在windows下的cmd中用python +easy_install.py 安装成功之后试试 easy_install 回车 看看是否成功, 妈妈再也不用担心安装python包的问题了

2015-08-12

社交网络分析数据挖掘python版本

社交网络分析数据挖掘与分析python完整版本的

2015-08-12

用vc做一个桌面闹钟

用vc做一个桌面闹钟 一个比较简单的设计

2010-12-29

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除