- 博客(3)
- 收藏
- 关注
原创 PRML Charpter 2 Probability Distribution 2.3.5 Sequential estimation讲义摘要
2.3.4和2.3.5节分别介绍了求解高斯分布的最大似然估计的两种方法, 2.3.4节是先给出似然函数,然后求似然函数最大值。2.3.5节介绍了一种序列化估计方法。 序列化估计的思想是根据已有数据得出一个估计,等有新的数据之后,再用新数据对上一步估计结果进行修正,得到新的估计值。 这种方法在一些在线应用,或数据比较大的情况下,用批处理的方法不能处理完所有数据情况下,经常使用。 这里介绍了一种通
2015-03-11 20:01:46 773
翻译 基于单边Jacobi旋转的并行SVD算法-MPI框架
单边Jacobi方法的核心思想是采用一系列Jacobi平面旋转变换[1],对维度为m*n的矩阵A进行正交化, B=A(J1J2J3...),使得B中任意两列向量满足bj.T*bj=0 , 然后对Bm*n归一化得到,Jacobi平面旋转变换的结构如公式(1)所示: (i,j)表示消去元素在矩阵中的位置(c表示cosθ, s表示sinθ,θ称为旋转角)。可以证明JTJ=I, Ja
2013-10-30 17:10:54 4446 3
原创 大规模文档相似度计算—基于MapReduce框架
现有Doc-word矩阵,采用余弦计算两两文档之间的相似度。在实际问题中,矩阵通常是很稀疏的,为了减少计算量,通常采用倒排索引的数据结构[1], 将包含相同word的doc映射到同一个节点上, 这样只需计算相似度不为0的文档之间的相似度, 从而减少计算量,具体过程如图1所示。 图1. 建立倒排索引计算文档相似度(来源于参考文献[1]) 上述方法虽然避
2013-10-30 15:41:48 1567
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人