- 博客(16)
- 资源 (104)
- 收藏
- 关注
原创 随机采样和随机模拟:吉布斯采样Gibbs Sampling实现高斯分布参数推断
http://blog.csdn.net/pipisorry/article/details/51539739吉布斯采样的实现问题本文主要说明如何通过吉布斯采样来采样截断多维高斯分布的参数(已知一堆截断高斯分布的数据,推断其参数( μ , Σ ))。关于吉布斯采样的介绍文章都停止在吉布斯采样的详细描述上,如随机采样和随机模拟:吉布斯采样Gibbs Sampling(why)
2016-05-30 20:08:51 11850 3
原创 随机采样和随机模拟:吉布斯采样Gibbs Sampling实现文档分类
http://blog.csdn.net/pipisorry/article/details/51525308吉布斯采样的实现问题本文主要说明如何通过吉布斯采样进行文档分类(聚类),当然更复杂的实现可以看看吉布斯采样是如何采样LDA主题分布的[主题模型TopicModel:隐含狄利克雷分布LDA]。关于吉布斯采样的介绍文章都停止在吉布斯采样的详细描述上,如随机采样和随机
2016-05-29 21:23:59 20704
原创 参数估计:文本分析的参数估计方法
http://blog.csdn.net/pipisorry/article/details/51482120文本分析的三类参数估计方法-最大似然估计MLE、最大后验概率估计MAP及贝叶斯估计。参数估计参数估计中,我们会遇到两个主要问题:(1)如何去估计参数的value。(2)估计出参数的value之后,如何去计算新的observation的概率,即进行回归分析和预测。首先定义一些符号:数据集X中
2016-05-23 17:36:47 15867 2
原创 参数估计:贝叶斯思想和贝叶斯参数估计
http://blog.csdn.net/pipisorry/article/details/51471222贝叶斯与频率派思想频率派思想 长久以来,人们对一件事情发生或不发生,只有固定的0和1,即要么发生,要么不发生,从来不会去考虑某件事情发生的概率有多大,不发生的概率又是多大。而且事情发生或不发生的概率虽然未知,但最起码是一个确定的值。比如如果问那时的人们一个问题:“有一个袋子,里面装着
2016-05-23 10:54:29 60976 7
原创 参数估计:最大似然估计MLE
http://blog.csdn.net/pipisorry/article/details/51461997最大似然估计MLE顾名思义,当然是要找到一个参数,使得L最大,为什么要使得它最大呢,因为X都发生了,即基于一个参数发生的,那么当然就得使得它发生的概率最大。最大似然估计就是要用似然函数取到最大值时的参数值作为估计值,似然函数可以写做相乘因为它们之间是独立同分布的。由于有连乘运算,通常对似然
2016-05-21 16:57:50 46517
原创 PGM:概率图模型Graphical Model
http://blog.csdn.net/pipisorry/article/details/51461878概率图模型Graphical Models简介完全通过代数计算来对更加复杂的模型进行建模和求解。然而,我们会发现,使用概率分布的图形表示进行分析很有好处。这种概率分布的图形表示被称为概率图模型( probabilistic graphical models )。这些模型提供了几个有用的性质
2016-05-21 16:57:42 25300
原创 随机采样和随机模拟:吉布斯采样Gibbs Sampling
http://blog.csdn.net/pipisorry/article/details/51373090吉布斯采样算法详解为什么要用吉布斯采样什么是sampling?sampling就是以一定的概率分布,看发生什么事件。举一个例子。甲只能E:吃饭、学习、打球,时间T:上午、下午、晚上,天气W:晴朗、刮风、下雨。现在要一个sample,这个sample可以是:打球+下午+晴朗。...
2016-05-12 00:24:21 108090 26
原创 同步图计算:GraphLite的安装和使用
http://blog.csdn.net/pipisorry/article/details/51350908linux中直接运行graphliteRequirements1. JDK 1.7.x + Hadoop 2.6.xlinux中hadoop直接安装参考[Hadoop:Hadoop单机伪分布式的安装和配置]2. protocol bufferspika:~$sudo apt-get upd
2016-05-09 11:17:14 3982
原创 Hadoop:hadoop fs、hadoop dfs与hdfs dfs命令的区别
http://blog.csdn.net/pipisorry/article/details/51340838'Hadoop DFS'和'Hadoop FS'的区别While exploring HDFS, I came across these two syntaxes for querying HDFS:> hadoop dfs> hadoop fswhy
2016-05-07 23:58:26 44258 4
原创 Hadoop:Hadoop单机伪分布式的安装和配置
http://blog.csdn.net/pipisorry/article/details/51331734本文内容:使用docker配置hadoop单机伪分布式开发环境本教程配置环境:docker (virtual box / virtual machine或者直接用ubuntu14.04都ok!,建议还是用虚拟机,docker太难搞了,没有配置的官方文件)ubuntu
2016-05-06 15:11:07 9476
原创 Docker教程:Docker镜像导出及迁移
Docker目录分析安装docker时,默认的安装位置是/var/lib/docker。$sudo ls /var/lib/docker/aufs containers graph init linkgraph.db repositories-aufstmp trust volumesrepositories-aufs:记录了镜像名称以及对应的
2016-05-06 11:36:06 63524 1
原创 Hadoop:Hadoop简介及环境配置
http://blog.csdn.net/pipisorry/article/details/51243805Hadoop简介下次写上。。。皮皮blog配置hadoop环境环境变量:$ echo $PATH/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games
2016-05-04 14:55:05 1187
Parameter estimation for text analysis
2016-05-23
pdfstudio安装文件及破解
2016-03-24
matplotlib安装包
2016-01-02
pandas安装文件
2016-01-01
matplotlib安装文件
2016-01-01
GB2UTF8.exe
2015-08-07
A First Course in Probability 第8版 Sheldon Ross
2014-10-31
wps symbol fonts
2017-02-27
Anand.Rajaraman-Mining of Massive Datasets
2016-06-01
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人