五年经验大佬带你掌握基于Hadoop与Spark的大数据开发实战

小迁W️：bjmsb2019

于 2020-02-20 15:51:58 发布

阅读量763

点赞数

分类专栏： Hadoop spark 大数据文章标签：分布式数据库大数据 hadoop spark

科技

本文链接：https://blog.csdn.net/Ppikaqiu/article/details/104411954

版权

本书详述了Hadoop和Spark在大数据处理中的应用，涵盖Hadoop分布式存储、计算框架、数据库及综合实践，同时深入讲解Spark Core、SQL和Streaming，提供了一个全面的大数据开发视角。

摘要由CSDN通过智能技术生成

在这里插入图片描述

前言：

本书以Hadoop和Spark为核心，阐述了基于这两种通用大数据处理平台的应用开发技术。

在Hadoop生态圈中，从HDFS初识分布式存储系统;以MapReduce详解f分布式计算的步骤;利用HBase分析适合非结构化数据存储的分布式数据库;利用Hive分析将SQL查询转化为分布式计算的过程;并结合项目案例“音乐排行榜”练习Hadoop核心技能点的运用;同时，介绍了几种离线处理系统中常用的辅助工具。

在Spark生态圈中，从Scala开始介绍多范式编程;并从Spark Core、Spark SQL、Spark
Streaming三个方面来分析对比Hadoop生态圈中的分布式计算、Hive、流式计算的可替换方案和它们各自的优势。

设计思路

本书共12章，内容包括Hadoop初体验、Hadoop分布式文件系统、Hadoop分布式计算框架、Hadoop 新特性、Hadoop 分布式数据库、Hadoop 综合实战一音乐排行榜、数据仓库Hive、大数据离线处理辅助系统、Spark 基础、Spark Core、Spark SQL和Spark Streaming.具体内容安排如下。

第1章：Hadoop初体验

➢第1章是对Hadoop的总体概述，介绍大数据基本概念、Hadoop

最低0.47元/天解锁文章

小迁W️：bjmsb2019

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
五年经验大佬带你掌握基于Hadoop与Spark的大数据开发实战

前言：本书以Hadoop和Spark为核心，阐述了基于这两种通用大数据处理平台的应用开发技术。在Hadoop生态圈中，从HDFS初识分布式存储系统;以MapReduce详解f分布式计算的步骤;利用HBase分析适合非结构化数据存储的分布式数据库;利用Hive分析将SQL查询转化为分布式计算的过程;并结合项目案例“音乐排行榜”练习Hadoop核心技能点的运用;同时，介绍了几种离线处理系统中常...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。