1.0 Hadoop - 子目录

最新推荐文章于 2022-04-04 18:07:57 发布

寒暄

最新推荐文章于 2022-04-04 18:07:57 发布

阅读量432

点赞数

分类专栏： ▼寒暄_大数据

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_41106844/article/details/105553369

版权

▼寒暄_大数据专栏收录该内容

4 篇文章 2 订阅

订阅专栏

本文全面介绍了Hadoop及其生态系统，包括HDFS、MapReduce、YARN等核心组件，详细解析了MapReduce的工作原理，并提供了搭建指南。此外，还涵盖了ZooKeeper、HBase、Hive、Flume、Sqoop、Kafka以及Spark、Flink等大数据处理工具的理论与实践，适合初学者及进阶者阅读。

摘要由CSDN通过智能技术生成

0.0 总目录

1.0.1前言:为什么会有大数据

1.1什么是Hadoop

1.2模块介绍

1.2.1什么是HDFS

1.2.2什么是MapReduce

1.2.2.1Job的提交（源码解读）

1.2.2.2Map-Task（源码解读）

1.2.2.3Reduce-Task（源码解读）

1.2.2.4eclipse开发MapReduce

1.2.2.5MapReduce实例

1.2.3什么是YARN

1.3Hadoop搭建

1.3.1搭建Hadoop前的准备

1.3.2伪分布式搭建

1.3.3完全分布式搭建

1.3.4Hadoop-HA（高性能）模式搭建-理论

1.3.4.1手动Hadoop-HA（高性能）模式搭建

1.3.4.2自动Hadoop-HA（高性能）模式搭建

1.4Hadoop生态圈

1.4.1ZooKeePer

1.4.1.1ZooKeePer的安装

1.4.1.2ZooKeePer简单用法

1.4.2HBASE（理论）

1.4.3Hive（理论）

1.4.3.1Hive部署

1.4.3.2Hive小试牛刀

1.4.3.3Hive常用需知

1.4.3.4Hive数据类型

1.4.3.5Hive的DDL操作

1.4.3.6Hive的DML操作

1.4.3.7Hive的查询操作

1.4.3.8Hive的函数操作（上）

1.4.4Flume

1.4.5Sqoop

1.4.6Kafka

1.5Spark生态圈

1.5.1 Spark概述

1.5.1.1 Spark-RDD

1.5.1.2 Spark的部署与安装

1.5.1.3 spark-submit命令参数详解与调优

1.5.1.4Spark算子详解(总览)

1.5.1.4 常用算子之map/flatmap/mapPartitions/glom算子

1.5.2 Spark SQL

1.5.3 Spark streaming

1.5.3 Spark mlLib

1.6Fink生态圈

1.7 Lucene

1.8 Ambari+HDP搭建hadoop(一)

1.8 Ambari+HDP搭建hadoop(二)

1.9CDH搭建Hadoop集群（一）

1.9CDH搭建Hadoop集群（二）

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
打赏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

寒暄 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。