Graph Computing
白 杨
这个作者很懒,什么都没留下…
展开
-
云计算环境下的大规模图数据处理技术
1. 引 言图是计算机科学中最常用的一类抽象数据结构, 在结构和语义方面比线性表和树更为复杂, 更具有一般性表示能力。 现实世界中的许多应用场景都需要用图结构表示, 与图相关的处理和应用几乎无所不在。 传统应用如最优运输路线的确定、疾病爆发路径的预测、科技文献的引用关系等; 新兴应用如社交网络分析、语义Web 分析、生物信息网络分析等。虽然图的应用和处理技术已经发展了很长时间, 理论也日趋完善, 但转载 2016-02-21 10:58:13 · 12218 阅读 · 0 评论 -
GraphX源码解析(Graph构建过程)
1. Graph构建Graph对象是用户的操作入口,主要包含edge和vertex两部分。边是由点组成,所以边中所有的点就是点的全集,但这个全集包含了重复的点,去重后就是VertexRDD。1.1 构建图的方法从边的集合构建图(Graph.fromEdges)def fromEdges[VD: ClassTag, ED: ClassTag]( edges: RDD[Edge[ED]],原创 2016-04-06 15:58:49 · 5670 阅读 · 0 评论 -
Zipf,Power-laws,Pareto分布
对于在对数坐标系中出现一条直线而言,三种分布都是可能的:Zipf,Power-laws和 Pareto。这三种分布都是用于描述同一种现象:大量事件是稀少的,而一些小事件确是很普遍的。 例如:成绩非常优异的学生是少数,但是成绩中等的学生却很多。(1)Zipf分布描述事件出现平率yy与其由下优先级r(Rank)r(Rank)之间的关系,按照Zipf模型,事件出现的平率与其优先级rr成反比:原创 2016-05-25 08:01:41 · 3375 阅读 · 0 评论