- 博客(3)
- 收藏
- 关注
原创 从零开始学习大数据之Spark(二)-RDD的创建和Spark SQL中的DataFrame的创建与查看(巨详细新手必备)
RDD和Spark SQL
2024-05-09 00:24:02
1549
原创 重生之从零开始学习大数据之Spark篇(一)
spark是一个用来实现快速,通用的集群计算平台,它基于Hadoop的MapReduce分布式框架优化并改进缺陷而形成的。在速度方面,Spark扩展了广泛使用的MapReduce计算模型,而且高效地支持更多计算模式,包括交互式查询和流处理。在处理大规模数据集事,速度是非常重要的。速度就以为这我们可以进行交互式的数据操作,否则我们每次操作就需要等待数分钟甚至数小时。Spark的一个主要特征就是能够在内存中计算,因而更快。不过即便是必须在磁盘上进行复杂计算,也比MapReduce更加高效。
2024-03-04 16:51:52
1947
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人