- 博客(4)
- 资源 (2)
- 收藏
- 关注
原创 LDA实现的两种方法
今天看到美帝一个实现LDA的法子,实现了一把,结果也对,参加方法2。可以对比方法1,计算量是降低了很多。 但无论如何,有一个显著的开销是很大的,这就是每个Wm,n 都需要记录一个类标签,也就是代码中doc那个三维矩阵,x表示文档编号{0-15},y表示term编号{0-4},z表示label{0-1} 假定文档有10M个(一千万),每篇文章1000个词,词典空间10K个,
2013-03-31 21:36:16 14562
原创 浅谈gibbs sampling(LDA实验)
先把问题描述一下:如果我们已知了topic内的每个词的词频,比如下图中topic1 中money 2 次,loan 3次...那么任意给一个文档我们可以对里面每一个词算一个产生这个词的概率即 P(w=wi|t=tj)如下图,doc1 中的money 百分之百的来自于topic1 。doc2 中的词用topic1 无法全部解释,必须借助topic2 。但现在问题是,如果我们只有一堆文档,
2013-03-22 10:39:35 26169 4
原创 浅析Likehood MAP MLE
举个例子说明Likehood MAP MLE假定有犯罪团伙A和犯罪团伙B。假定我们的概念有h{h1: 所抓得人是团伙A的h2: 所抓得人是团伙B的....}如果我们抓到了一票人是a1,a2,...an,那么这伙人是团伙A还是团伙B?即求解P( h|D={a1,a2,...an} )?假定从案底显示,团伙A有10个人,团伙B有20个人,团伙A被抓到的概
2013-03-20 10:50:49 6026
原创 关于编译器的一个问题
今天看了下@leekayak 提到的一个问题 http://weibo.com/1465082730/znOSZzU4v 我试图用一个简单的例子来解释下,首先看一段更简单的代码。 #include "stdio.h"#include "stdlib.h"#include int f = 0;int x= 0;void* t1(void*){
2013-03-17 13:32:14 5418 1
Topology-Calculation-Tuning本学期一份组内报告
2011-01-19
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人