sysuhu-CSDN博客

原创分层Dirichlet过程（HDP）的理解

承接这几篇而来《由中餐馆过程（CRP）理解狄利克雷过程（DP）》 http://blog.csdn.net/sysuhu/article/details/53725696 《从折棍子（Stick Breaking）模型到狄利克雷过程（DP）》 http://blog.csdn.net/sysuhu/article/details/54287684 《关于Dirichlet过程混合模

2017-01-12 15:30:01 7416 1

原创关于Dirichlet过程混合模型（DPMM）的理解

由CRP构造DPMM关于中餐馆过程可见《由中餐馆过程（CRP）理解狄利克雷过程（DP）》http://blog.csdn.net/sysuhu/article/details/53725696 而Dirichlet过程混合模型（DPMM）就是把CRP中的DP整个作为某一分布的先验来处理用图模型表示如下这里的FF则根据具体的问题而定，一般尽量使FF与GG是共轭的，以便于计算。由S

2017-01-12 15:24:38 10171 2

原创从折棍子（Stick Breaking）模型到狄利克雷过程（DP）

折棍子（Stick Breaking）过程先定义一个变量序列β1,β2,...,βi,...{\beta}_{1},{\beta}_{2},...,{\beta}_{i},...，其中，βi∼Beta(1,α){\beta}_{i}{\sim}Beta(1,\alpha) 根据BetaBeta分布的性质，0<βi<1,(i=1,2,...)0<{\beta}_{i}<1,(i=1,2,...)

2017-01-09 11:58:52 12473 6

原创 logging的使用

相比使用print的好处之一是：logging可以实时输出，而print要通过管道，不能做到实时输出，一般过一段时间才能通过tail -f命令查看得到输出结果。import logginglogging.basicConfig(level=logging.DEBUG, format = '%(asctime)s %(filename)s[line: %(lineno)d] %(le

2016-03-24 21:33:20 397

原创我的pandas使用笔记

新建一个空的DataFrame对象>>>df_null = DataFrame({}, columns=['name', 'age'])>>>df_nullEmpty DataFrameColumns: [name, age]Index: [][0 rows * 2 columns]

2016-03-18 16:32:42 423

空空如也

在Spark SQL中，列名为敏感词汇时如何处理？

2015-06-03

Spark平台下运行WordCount时遇到如下的报错该如何处理？求各路大神指教。。。

2015-05-19

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

原创 分层Dirichlet过程（HDP）的理解

原创 关于Dirichlet过程混合模型（DPMM）的理解

原创 从折棍子（Stick Breaking）模型到狄利克雷过程（DP）