大数据技术第十章总结

最新推荐文章于 2024-10-08 22:30:00 发布

m0_65265340

最新推荐文章于 2024-10-08 22:30:00 发布

阅读量182

点赞数 2

文章标签：大数据

本文链接：https://blog.csdn.net/m0_65265340/article/details/141936535

版权

Spark是基于内存计算的大数据并行计算框架，可用于构建大型的、低延迟的数据分析应用程序。

Spark特点

运行速度快：使用DAG执行引擎以支持循环数据流与内存计算
容易使用：支持使用Scala、Java、Python和R语言进行编程，可以通过Spark Shell进行交互式编程
通用性：Spark提供了完整而强大的技术栈，包括SQL查询、流式计算、机器学习和图算法组件
运行模式多样：可运行于独立的集群模式中，可运行于Hadoop中，也可运行于Amazon EC2等云环境中，并且可以访问HDFS、Cassandra、HBase、Hive等多种数据源