山东大学软件工程应用与实践——Spark

最新推荐文章于 2022-10-21 13:53:25 发布

SDU_CH

最新推荐文章于 2022-10-21 13:53:25 发布

阅读量395

点赞数 3

文章标签： spark big data scala

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_46002973/article/details/120556156

版权

2021SC@SDUSC

目录

一、Spark使用场景

二、Spark特点

三、项目准备

四、组内分工

五、未来博客更新

一、Spark使用场景

Hadoop常见于解决高吞吐量、批量处理的业务场景，但是如果需要实时查看浏览量统计信息，Hadoop显然不符合这样的要求。

Spark通过内存计算能力极大地提高了大数据处理速度，满足了以上场景地需求，同时，通过对Java、python等语言的支持，极大的方便了用户地使用。而且，Spark还支持SQL查询、流式计算、图计算、机器学习等。

二、Spark特点

1.快速处理能力。

2.易于使用。Spark支持Java、Scala、python等语言编写应用程序，大大降低了使用者的门槛;

3.支持查询。Spark支持SQL以及Hive SQL对数据查询;

4.支持流式计算。与MapReduce只能处理离线数据相比，Spark还能够支持实时的流计算。依赖Spark Streaming对数据进行实时处理，能力强于Storm。

5.可用性高。Spark自身实现了Standalone部署模式，此模式下Master可以有多个，能够解决单点故障问题。

6.丰富的数据源支持。除了可以访问操作系统自身的文件系统和HDFS，还可以访问HBase、Hive以及任何Hadoop的数据源。

三、项目准备

１．运行环境准备

2.Spark体验

3.阅读环境准备

4.Spark源码编译与调试

四、组内分工

Spark Core 李子旭、王博涵

Spark Streaming　陈政

Spark SQL　于成龙

Graphx　迟淏

五、未来博客更新

未来会深入研究Spark，及时做出相应的代码分析。

关注

3
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
山东大学软件工程应用与实践——Spark

2021SC@SDUSC一、Spark使用场景 Hadoop常见于解决高吞吐量、批量处理的业务场景，但是如果需要实时查看浏览量统计信息，Hadoop显然不符合这样的要求。Spark通过内存计算能力极大地提高了大数据处理速度，满足了以上场景地需求，同时，通过对Java、python等语言的支持，极大的方便了用户地使用。而且，Spark还支持SQL查询、流式计算、图计算、机器学习等。二、Spark特点快速处理能力。易于使用。Spark支持Java、Scala、python等语言编写应用程..
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。