The Data
天下无双_
这个作者很懒,什么都没留下…
展开
-
BSP
BSP即Bulk Synchronous Programing(大同步编程)。在处理海量数据时,MapReduce能很容易搞定JOIN、GROUP BY等操作,而且节点与节点之间信息的交互通常只发生shuffle中。当时实际中经常会遇到一步搞不定的事情:1、聚类算法2、图算法3、其他,比如PageRank等。用MapReduce来实现比较复杂,但是在单机上处理这原创 2013-10-30 13:28:10 · 909 阅读 · 0 评论 -
ODPS Graph
ODPS Graph是一个搭建在飞天上的面向迭代的分布式处理框架,支持类似Pregel的Java编程接口,用户可以基于Graph框架开发高效的机器学习算法。原创 2013-10-31 02:47:50 · 1597 阅读 · 0 评论