spark
文章平均质量分 65
飞奔的帅帅
马云给你还花呗
展开
-
RDD编程指南
RDD编程基础原创 2022-06-12 18:54:43 · 530 阅读 · 3 评论 -
spark3快速入门
spark简单介绍CachingSelf-C原创 2022-06-12 17:49:36 · 631 阅读 · 0 评论 -
spark master的部署方式
我们在初始化SparkConf时,或者提交Spark任务时,都会有master参数需要设置,如下:conf = SparkConf().setAppName(appName).setMaster(master)sc = SparkContext(conf=conf)/bin/spark-submit \ --cluster cluster_name \ --master yarn-cluster \ ...但是这个master到底是.转载 2020-06-11 13:45:13 · 989 阅读 · 0 评论 -
分布式机器学习之——Spark MLlib并行训练原理
这里是 王喆的机器学习笔记 的第二十五篇文章。接下来的几篇文章希望与大家一同讨论一下机器学习模型的分布式训练的问题。这个问题在推荐、广告、搜索领域尤为突出,因为在互联网场景下,动辄TB甚至PB级的数据量,几乎不可能利用单点完成机器学习模型的训练,分布式机器学习训练成为唯一的选择。在笔者看来,分布式机器学习训练有三个主要的方案,分别是Spark MLlib,Parameter Server和TensorFlow,倒不是说他们是唯三可供选择的平台,而是因为他们分别代表着三种主流的解决分布式训练方法。今天我们转载 2020-06-10 01:33:56 · 798 阅读 · 3 评论