Spark
SeaSky_Steven
这个作者很懒,什么都没留下…
展开
-
Spark(三):pyspark的使用
从这个名字pyspark就可以看出来,它是由python和spark组合使用的.相信你此时已经电脑上已经装载了hadoop,spark,python3.那么我们现在开始对pyspark进行了解一番(当然如果你不想了解直接往下翻找pyspark的使用):1. 背景: 产生与加州大学伯克利分校AMP实验室,2013年6月称为Apache成为孵化项目,使用Scala语言进行实现的,...转载 2020-01-03 15:10:29 · 729 阅读 · 0 评论 -
Spark(二): spark-submit命令详解
spark-submit命令利用可重用的模块形式编写脚本,并且以编程方式提交作业到Spark。spark-submit命令spark-submit命令提供一个统一的API把应用程序部署到各种Spark支持的集群管理器上,从而免除了单独配置每个应用程序。命令行参数下面逐个介绍这些参数: --master:用于设置主结点URL的参数。 local:用于执行本地机器...转载 2020-01-03 15:04:38 · 2736 阅读 · 0 评论 -
Spark(一): 基本架构及原理
Apache Spark是一个围绕速度、易用性和复杂分析构建的大数据处理框架,最初在2009年由加州大学伯克利分校的AMPLab开发,并于2010年成为Apache的开源项目之一,与Hadoop和Storm等其他大数据和MapReduce技术相比,Spark有如下优势:Spark提供了一个全面、统一的框架用于管理各种有着不同性质(文本数据、图表数据等)的数据集和数据源(批量数据或实时的...转载 2020-01-03 15:03:02 · 169 阅读 · 0 评论