- 博客(3)
- 收藏
- 关注
原创 [spark]在集群上运行spark
目录 1、spark运行时架构 2、两种操作:转化操作和行动操作 3、在集群上运行应用程序 4、使用spark-submit部署应用 1、spark运行时架构 运行时架构描述: spark-submit启动驱动器 驱动器和集群管理器通信,为执行器申请资源 集群管理器启动执行器 不同结点的职责: 结点类型 职责 驱动器 ...
2018-11-23 09:04:22 677
原创 [近邻推荐]基于邻域的算法-协同过滤算法
目录 1、相似度的度量 2、基于用户的协同过滤算法 2.1 算法原理 2.2 用户相似度计算的改进 2.3 使用的场景 3、基于物品的协同过滤算法 3.1 算法原理 3.2 物品相似度计算的改进 3.3 使用的场景 4、userCF和itemCF比较 1、相似度的度量 欧氏距离,度量的是空间中两个点的绝对差异,适用于分析用户能力模型之间的差异: 余弦相似度,度量的是两...
2018-11-21 20:46:42 958
原创 [图]python实现图的遍历、最小生成树、最短路径
目录 1、图遍历 2、最小生成树-Prime算法 3、最短路径-Dijkstra算法 图的两种常用的表示方式是邻接矩阵和邻接表。以下以邻接矩阵为例,图的初始化定义: class Graph(): def __init__(self,nodeNum,sides,direction=False): self.nodeNum = nodeNum #顶点 ...
2018-11-13 21:40:50 5793 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人