自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

玉心sober

step by step...then...

  • 博客(5)
  • 收藏
  • 关注

原创 c++ 学习总结

1、出现segmentation default的原因:这个内存区要么是不存在的,要么是受到系统保护的。 例如:char *p=null,之后直接使用p而并没有进行malloc,就会出现这种错误

2013-07-30 10:12:53 2545

原创 linux、Hadoop相关的常用东西总结

总结一下最近的工作,如下,且会不断更新: 1、下载软件SecureCRT或者putty(or pietty),可用来在windows远程登录(ssh1、ssh2)到linux服务器。 SecureCRT和pietty各有优缺点,体会了下,总结以下几点: 1)pietty安装使用直接方便,不怎么需要配置,直接拿来用即可,且默认设置挺漂亮。而SecureCRT安装后根据使用习惯需要设置字

2013-07-23 21:40:34 2884

原创 大规模数据相似度计算时,解决数据倾斜的问题的思路之一(分块思想)

现有user、item矩阵,如何计算两两用户的相似度呢?最直接的方法就是夹角余弦,计算用户向量之间的cos值,来度量相似度。因为实际问题中,矩阵通常是很稀疏的,所以真正实现cos计算相似度计算的时候,为了减少计算量,采用的的是倒排索引的数据结构。即: 虽然采用的倒排的结构,但是用户量和item量很大,且有些item对应的用户量很大的时候,就会出现严重的数据倾斜问题。以MapReduce实

2013-07-08 17:33:28 12654 3

原创 MPI学习笔记(1)

今天开始学习写MPI,基本过程: 1)配置mpi环境 2)拿一小段MPI代码试验,来自:http://blog.csdn.net/zhuliting/article/details/5868425 #include #include #include "mpi.h" int main(int argc,char *argv[]) { int i,j,k,n,myid,numpro

2013-07-01 16:09:10 2924

原创 BSP编程模型(以NMF为例,试验基于消息传递的模型BSP过程)

对于需要迭代计算的算法,MapReduce显然不可用,迭代n次的IO量太大,而基于消息的传递模型,BSP和MPI的优势就出来了。BSP的编程模型,试验过了,确实容易入门,只要将求解问题(例如,优化问题、图的最短路径问题等等)抽象成图模型(顶点Vertex、边Edge)后,再通过消息Message,来不断迭代求解即可。拿前面有篇文章,NMF的矩阵分解这个优化问题,来实验: 1)NMF的矩阵分解基本

2013-07-01 15:33:35 4754 4

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除