![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Spark
一只哈士奇
正在学习ing
展开
-
spark基本架构及原理
架构及生态: Spark Core:包含Spark的基本功能;尤其是定义RDD的API、操作以及这两者上的动作。其他Spark的库都是构建在RDD和Spark Core之上的 Spark SQL:提供通过Apache Hive的SQL变体Hive查询语言(HiveQL)与Spark进行交互的API。每个数据库表被当做一个RDD,Spark SQL查询被转换为Spark操作。 Spark Streaming:对实时数据流进行处理和控制。Spark Streaming允许程序能够像...转载 2021-07-12 18:40:23 · 353 阅读 · 0 评论 -
使用SparkCore中aggregateByKey报错Task not serializable
使用SparkCore中aggregateByKey报错Task not serializable 求大佬帮忙看看原因在哪 具体代码如下: package com.atguigu.bigdata.spark.core.rdd import org.apache.spark.rdd.RDD import org.apache.spark.{SparkConf, SparkContext} object Spark08_RDD_aggregateByKey { def main(args: Array原创 2021-03-08 22:22:42 · 424 阅读 · 5 评论