2013年03月_pennyliang

12月 04月 03月 02月 01月

原创 LDA实现的两种方法

今天看到美帝一个实现LDA的法子，实现了一把，结果也对，参加方法2。可以对比方法1，计算量是降低了很多。但无论如何，有一个显著的开销是很大的，这就是每个Wm,n 都需要记录一个类标签，也就是代码中doc那个三维矩阵，x表示文档编号{0-15}，y表示term编号{0-4}，z表示label{0-1} 假定文档有10M个（一千万），每篇文章1000个词，词典空间10K个，

2013-03-31 21:36:16 14562

原创浅谈gibbs sampling（LDA实验）

先把问题描述一下：如果我们已知了topic内的每个词的词频，比如下图中topic1 中money 2 次，loan 3次...那么任意给一个文档我们可以对里面每一个词算一个产生这个词的概率即 P(w=wi|t=tj)如下图，doc1 中的money 百分之百的来自于topic1 。doc2 中的词用topic1 无法全部解释，必须借助topic2 。但现在问题是，如果我们只有一堆文档，

2013-03-22 10:39:35 26169 4

原创浅析Likehood MAP MLE

举个例子说明Likehood MAP MLE假定有犯罪团伙A和犯罪团伙B。假定我们的概念有h{h1: 所抓得人是团伙A的h2: 所抓得人是团伙B的....}如果我们抓到了一票人是a1,a2,...an，那么这伙人是团伙A还是团伙B？即求解P( h|D={a1,a2,...an} )？假定从案底显示，团伙A有10个人，团伙B有20个人，团伙A被抓到的概

2013-03-20 10:50:49 6026

原创关于编译器的一个问题

今天看了下@leekayak 提到的一个问题 http://weibo.com/1465082730/znOSZzU4v 我试图用一个简单的例子来解释下，首先看一段更简单的代码。 #include "stdio.h"#include "stdlib.h"#include int f = 0;int x= 0;void* t1(void*){

2013-03-17 13:32:14 5418 1

Topology-Calculation-Tuning本学期一份组内报告

这是一个在组内做的技术报告，从技术的观点，介绍了布局，计算和调优的工作，这些工作是一个工程师的必修课，这里以点带面的进行了展开，是为了表明，编代码不是盲目的写，而是要有计划，有层次，有把握地去写，我水平有限，这些只是自己的思考，因为我还刚上路呢。。。

2011-01-19

微软企业文化内训资料

微软企业文化内训资料，该资料主要介绍微软组织架构，价值观，管理理念等等

2010-07-09

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人