Spark
小刘同学-很乖
这个作者很懒,什么都没留下…
展开
-
Spark详细案例实操
Spark Shell仅在测试和验证我们的程序时使用的较多,在生产环境中,通常会在IDE中编制程序,然后打成jar包,然后提交到集群,最常用的是创建一个Maven项目,利用Maven来管理jar包的依赖。编写WordCount程序创建一个Maven项目WordCount并导入依赖<dependencies> <dependency> <...原创 2020-07-24 08:30:32 · 1795 阅读 · 0 评论 -
Spark运行模式之Yarn模式详解
Yarn模式概述Spark客户端直接连接Yarn,不需要额外构建Spark集群。有yarn-client和yarn-cluster两种模式,主要区别在于:Driver程序的运行节点。yarn-client:Driver程序运行在客户端,适用于交互、调试,希望立即看到app的输出yarn-cluster:Driver程序运行在由RM(ResourceManager)启动的AP(APPMast...原创 2020-07-23 10:31:42 · 1524 阅读 · 0 评论 -
Spark运行模式之Standalone模式详解
Standalone模式概述构建一个由Master+Slave构成的Spark集群,Spark运行在集群中安装使用进入spark安装目录下的conf文件夹[liujh@hadoop102 module]$ cd spark/conf/修改配置文件名称[liujh@hadoop102 conf]$ mv slaves.template slaves[liujh@hadoo...原创 2020-07-22 09:11:09 · 1249 阅读 · 0 评论 -
Spark运行模式之Local模式详解
Spark安装地址官网地址http://spark.apache.org/文档查看地址https://spark.apache.org/docs/2.1.1/下载地址https://spark.apache.org/downloads.html重要角色Driver(驱动器)Spark的驱动器是执行开发程序中的main方法的进程。它负责开发人员编写的用来创建SparkConte...原创 2020-07-21 10:19:30 · 7694 阅读 · 1 评论 -
Spark详细概述
什么是Spark定义Spark是一种基于内存的快速、通用、可扩展的大数据分析引擎历史2009年诞生于加州大学伯克利分校AMPLab,项目采用Scala编写2010年开源2013年6月成为Apache孵化项目2014年2月成为Apache顶级项目Spark内置模块Spark Core:实现了Spark的基本功能,包含任务调度、内存管理、错误恢复、与存储系统交互等模块。Spar...原创 2020-07-21 10:19:10 · 299 阅读 · 0 评论