自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 PRML Charpter 2 Probability Distribution 2.3.5 Sequential estimation讲义摘要

2.3.4和2.3.5节分别介绍了求解高斯分布的最大似然估计的两种方法, 2.3.4节是先给出似然函数,然后求似然函数最大值。2.3.5节介绍了一种序列化估计方法。序列化估计的思想是根据已有数据得出一个估计,等有新的数据之后,再用新数据对上一步估计结果进行修正,得到新的估计值。 这种方法在一些在线应用,或数据比较大的情况下,用批处理的方法不能处理完所有数据情况下,经常使用。这里介绍了一种通

2015-03-11 20:01:46 772

翻译 基于单边Jacobi旋转的并行SVD算法-MPI框架

单边Jacobi方法的核心思想是采用一系列Jacobi平面旋转变换[1],对维度为m*n的矩阵A进行正交化, B=A(J1J2J3...),使得B中任意两列向量满足bj.T*bj=0, 然后对Bm*n归一化得到,Jacobi平面旋转变换的结构如公式(1)所示: (i,j)表示消去元素在矩阵中的位置(c表示cosθ, s表示sinθ,θ称为旋转角)。可以证明JTJ=I, Ja

2013-10-30 17:10:54 4443 3

原创 大规模文档相似度计算—基于MapReduce框架

现有Doc-word矩阵,采用余弦计算两两文档之间的相似度。在实际问题中,矩阵通常是很稀疏的,为了减少计算量,通常采用倒排索引的数据结构[1], 将包含相同word的doc映射到同一个节点上, 这样只需计算相似度不为0的文档之间的相似度, 从而减少计算量,具体过程如图1所示。        图1. 建立倒排索引计算文档相似度(来源于参考文献[1])        上述方法虽然避

2013-10-30 15:41:48 1565

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除