(1)大数据hadoop

最新推荐文章于 2024-07-12 16:01:56 发布

doublejie1001

最新推荐文章于 2024-07-12 16:01:56 发布

阅读量91

点赞数

分类专栏：大数据文章标签： hadoop big data

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sinat_41636155/article/details/119870470

版权

大数据专栏收录该内容

6 篇文章 0 订阅

订阅专栏

来源非常感谢
https://www.bilibili.com/video/BV1Qp4y1n7EN?p=9&spm_id_from=pageDriver
共178集预计一周看完每天30集
在这里插入图片描述
大数据特点
大量
高速
多样
低价值密度

hadoop框架
一、概念
1 是什么
由apache基金会所开发的分布式系统基础架构
主要解决海量的数据的存储和分析计算问题
广义上来说是hadoop生态圈,例如hbase hive

2 发展历史
3 三大版本
apache cloudera（CDH）收费 hortonworks(HDP)之前免费现在收费。免费版hadoop3.0
在这里插入图片描述

4 优势
高可靠性——底层维护多个数据副本，保证数据不丢失
高扩展性——动态增加删除服务器
高效性——并行工作，加快处理速度
高容错性——自动将失败的任务重新分配

5 组成
hadoop1.0
common(辅助工具)
HDFS
MapReduce(计算+资源调度)

hadoop2.0
MapReduce(计算+资源调度) 变成 MapReduce(计算)+YARN(资源调度)

在这里插入图片描述
HDFS

namenode 数据都存在什么位置
datanode 具体存储数据
2NN 辅助namenode

YARN
resourceManager
nodeManager
applicationMaster
container

客户端可以有多个
集群上可以运行多个application
每个nodemanager可以有多个container
在这里插入图片描述

MapReduce

三者关系
在这里插入图片描述

6 大数据技术生态体系
在这里插入图片描述

7 推荐系统案例

二、环境准备
1 模拟虚拟机准备
2 克隆
3 安装JDK,hadoop

三、生产环境搭建
1 本地模式
2 完全分布式集群

四、常见错误解决方案

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
(1)大数据hadoop

来源非常感谢https://www.bilibili.com/video/BV1Qp4y1n7EN?p=9&spm_id_from=pageDriver共178集预计一周看完每天30集大数据特点大量高速多样低价值密度hadoop框架一、概念1 是什么由apache基金会所开发的分布式系统基础架构主要解决海量的数据的存储和分析计算问题广义上来说是hadoop生态圈,例如hbase hive2 发展历史3 三大版本apache cloudera（CDH）收
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。