安装Spark-单机部署,Standalone集群部署,Spark on Yarn实现
SparkSession也是Spark程序中的一个类,功能类似于SparkContext,Spark2.0以后推出的,如果Hadoop生态的程序,例如MR、Hive、Sqoop、Oozie等使用YARN来计算。2-存储实时工具元数据。资源管理和任务调度:将所有从节点的资源在逻辑上合并为一个整体,将任务分配给不同的从节点。使用自己所在节点的资源运行计算进程Executor:给每个计算进程分配一定的资源。YARN支持多种类型程序的运行:MR、Tez、Spark、Flink等。
原创
2024-10-07 20:57:08 ·
1505 阅读 ·
0 评论