- 博客(4)
- 收藏
- 关注
原创 Spark MLlib LDA 源码解析
1、Spark MLlib LDA源码解析 http://blog.csdn.net/sunbow0 Spark MLlib LDA 应该算是比较难理解的,其中涉及到大量的概率与统计的相关知识,而且还涉及到了Spark GraphX图计算方面的知识,要想明白其中的原理得要下一番功夫。LDA源码解析前的基础知识: 1)LDA主题模型的理论知识 参照:LDA数学八卦 2)SparkG
2015-08-14 15:37:08 7074
转载 Spark GraphX Programming Guide 编程指南
6、 Spark GraphX Programming Guide 6.1 概述 GraphX是spark的一个新组件用于图和并行图计算。在一个高水平,GraphX通过引进一个新的图抽象扩展了spark RDD:带有顶点和边属性的有向多重图。为了支持图计算,GraphX 提供了很多基本的操作(像 subgraph, joinVertices, and aggregateMessages
2015-08-13 14:38:09 3336
转载 Spark Graphx 构建graph和aggregateMessages聚合消息
Graphx:构建graph和聚合消息 @玄畅 2014.12.29 About 最近在优化kcore算法时,对Graphx代码看了几遍。1.2后Graphx性能有所提升,代码不太容易理解,现在用图表示出来会更直观。 对数学上的图有点印象的是x轴、y轴坐标图,坐标中每个点用横坐标x和纵坐标y表示,即: (x1, y1), (x2, y2), 一个坐标点可以确定一个点的唯一
2015-08-13 12:03:21 5304
原创 Spark MLlib LDA主题模型
1、Spark MLlib LDA主题模型(1) Spark MLlib LDA主题模型是Spark1.3开始加入的,具体介绍看以下文档: 官方编程指南: http://spark.apache.org/docs/latest/mllib-clustering.html#latent-dirichlet-allocation-lda Spark MLlib LDA 简介: http://
2015-08-07 11:52:22 14235 10
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人