微软、阿里、百度、腾讯都在使用的Spark大数据分析实战

最新推荐文章于 2023-12-02 09:04:56 发布

BAO7988

最新推荐文章于 2023-12-02 09:04:56 发布

阅读量864

点赞数

分类专栏：大数据文章标签：大数据 spark

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/BAO7988/article/details/103489635

版权

本书深入浅出地介绍了Spark的基本概念、开发环境配置、生态系统组件、实时与离线数据分析流程，并通过Azure云平台、Twitter、新闻抓取等实例展示了Spark在日志分析、情感分析、推荐系统等领域的应用。适合数据分析和开发人员，机器学习工程师，以及对大数据技术感兴趣的人群学习。

摘要由CSDN通过智能技术生成

Spark作为一款基于内存的分布式计算框架，具有简洁的接口，可以快速构建上层数据分析算法，同时具有很好的兼容性，能够结合其他开源数据分析系统构建数据分析应用或者产品。

为了适合读者阅读和掌握知识结构，本篇从Spark基本概念和机制介绍人手，结合笔者实践经验讲解如何在Spark之上构建机器学习算法，并最后结合不同的应用场景构建数据分析应用。

读者对象

本篇中一些实操和应用章节，比较适数据分析和开发人员，可以作为工作手边书;

机器学习和算法方面的章节，比较适合机器学习和算法工程师，可以分享经验，拓展解决问题的思路。

口Spark初学者

口Spark应用开发人员

口Spark机器学习爱好者

口开源软件爱好者

口其他对大数据技术感兴趣的人员

如何阅读本篇

本书分为11章内容。

由于细节内容实在太多啦，所以只把部分知识点截图出来粗略的介绍，每个小节点里面都有更细化的内容！

第1章从Spark概念出发，介绍Spark的来龙去脉，阐述Spark机制与如何进行Spark编程。

第2章详细介绍Spark的开发环境配置。

第3章详细介绍Spark生态系统重要组件Spark SQL、Spark Streaming、GiraphX、MLlib的实现机制，为后续使用奠定基础。

最低0.47元/天解锁文章

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。