- 博客(5)
- 问答 (2)
- 收藏
- 关注
原创 分层Dirichlet过程(HDP)的理解
承接这几篇而来 《 由中餐馆过程(CRP)理解狄利克雷过程(DP)》 http://blog.csdn.net/sysuhu/article/details/53725696 《 从折棍子(Stick Breaking)模型到狄利克雷过程(DP)》 http://blog.csdn.net/sysuhu/article/details/54287684 《 关于Dirichlet过程混合模
2017-01-12 15:30:01 7416 1
原创 关于Dirichlet过程混合模型(DPMM)的理解
由CRP构造DPMM关于中餐馆过程可见《由中餐馆过程(CRP)理解狄利克雷过程(DP)》http://blog.csdn.net/sysuhu/article/details/53725696 而Dirichlet过程混合模型(DPMM)就是把CRP中的DP整个作为某一分布的先验来处理 用图模型表示如下 这里的FF则根据具体的问题而定,一般尽量使FF与GG是共轭的,以便于计算。由S
2017-01-12 15:24:38 10171 2
原创 从折棍子(Stick Breaking)模型到狄利克雷过程(DP)
折棍子(Stick Breaking)过程先定义一个变量序列β1,β2,...,βi,...{\beta}_{1},{\beta}_{2},...,{\beta}_{i},...,其中,βi∼Beta(1,α){\beta}_{i}{\sim}Beta(1,\alpha) 根据BetaBeta分布的性质,0<βi<1,(i=1,2,...)0<{\beta}_{i}<1,(i=1,2,...)
2017-01-09 11:58:52 12473 6
原创 logging的使用
相比使用print的好处之一是:logging可以实时输出,而print要通过管道,不能做到实时输出,一般过一段时间才能通过tail -f命令查看得到输出结果。import logginglogging.basicConfig(level=logging.DEBUG, format = '%(asctime)s %(filename)s[line: %(lineno)d] %(le
2016-03-24 21:33:20 397
原创 我的pandas使用笔记
新建一个空的DataFrame对象>>>df_null = DataFrame({}, columns=['name', 'age'])>>>df_nullEmpty DataFrameColumns: [name, age]Index: [][0 rows * 2 columns]
2016-03-18 16:32:42 423
空空如也
在Spark SQL中,列名为敏感词汇时如何处理?
2015-06-03
Spark平台下运行WordCount时遇到如下的报错该如何处理?求各路大神指教。。。
2015-05-19
TA创建的收藏夹 TA关注的收藏夹
TA关注的人