微软、阿里、百度、腾讯都在使用的Spark大数据分析实战

Spark作为一款基于内存的分布式计算框架,具有简洁的接口,可以快速构建上层数据分析算法,同时具有很好的兼容性,能够结合其他开源数据分析系统构建数据分析应用或者产品。

为了适合读者阅读和掌握知识结构,本篇从Spark基本概念和机制介绍人手,结合笔者实践经验讲解如何在Spark之上构建机器学习算法,并最后结合不同的应用场景构建数据分析应用。

读者对象

本篇中一些实操和应用章节,比较适数据分析和开发人员,可以作为工作手边书;

机器学习和算法方面的章节,比较适合机器学习和算法工程师,可以分享经验,拓展解决问题的思路。

口Spark初学者

口Spark应用开发人员

口Spark机器学习爱好者

口开源软件爱好者

口其他对大数据技术感兴趣的人员

如何阅读本篇

本书分为11章内容。

由于细节内容实在太多啦,所以只把部分知识点截图出来粗略的介绍,每个小节点里面都有更细化的内容!

第1章从Spark概念出发,介绍Spark的来龙去脉,阐述Spark机制与如何进行Spark编程。

第2章详细介绍Spark的开发环境配置。

第3章详细介绍Spark生态系统重要组件Spark SQL、Spark Streaming、GiraphX、MLlib的实现机制,为后续使用奠定基础。

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值