- 博客(1)
- 收藏
- 关注
原创 介绍 Apache Spark 的基本概念和在大数据分析中的应用。
Apache Spark 是一种开源的大数据处理框架,可以处理大规模数据集并支持复杂的计算任务。它是基于内存的计算,能够快速处理数据,并支持多种数据源,例如 HDFS、Cassandra、HBase 等。Transformations:是对 RDD 进行转换操作的函数,例如 map、filter、reduceByKey 等,这些函数可以将一个 RDD 转换为另一个 RDD。Actions:是对 RDD 进行操作的函数,例如 count、save、collect 等,这些函数可以触发实际的计算并返回结果。
2023-09-08 11:56:41
29
1
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人