大数据与Hadoop简介

最新推荐文章于 2020-05-27 15:55:37 发布

叁木-Neil

最新推荐文章于 2020-05-27 15:55:37 发布

阅读量217

点赞数

分类专栏： Hadoop 文章标签：大数据 Hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_39657909/article/details/84729707

版权

Hadoop 专栏收录该内容

60 篇文章 2 订阅

订阅专栏

大数据与Hadoop

1.大数据的特点
2.有哪些应用的场景
3.Hadoop的三大发行版本
4.Hadoop的优势
5.Hadoop的组成

1.大数据的特点

Volume（大量）：个人计算机硬盘的容量为TB级，而一些大企业的数据量已经接近EB量级了。
Velocity（高速）：这是大数据区分于传统数据挖掘的最显著特征。
Variety(多样)：这种类型的多样性也让数据被分为结构化数据（数据库/文本为主的结构化数据）和非结构化数据（日志、图片、视屏等）
Value(低密度)：价值密度的高低与数据总量的大小成反比！！！

2.有哪些应用的场景

物流仓储：大数据分析系统助力商家精细化运营、提升销量、节约成本
零售：分析用户消费习惯，为用户购买商品提供方便，从而提升商品销量
旅游：深度结合大数据能力与旅游产业智慧管理、智慧服务和智慧营销的未来
商品广告推荐：给用户推荐可能喜欢的商品。等等等等。。。。。

3.Hadoop的三大发行版本

Apache版本最原始（最基础）的版本，对于入门学习最好。
官网地址：http://hadoop.apache.org/releases.html
下载地址：https://archive.apache.org/dist/hadoop/common/
Cloudera在大型互联网企业中用的较多。
官网地址：https://www.cloudera.com/downloads/cdh/5-10-0.html
下载地址：http://archive-primary.cloudera.com/cdh5/cdh/5/
Hortonworks文档较好。
官网地址：https://hortonworks.com/products/data-center/hdp/
下载地址：https://hortonworks.com/downloads/#data-platform

4.Hadoop的优势

高可靠性：Hadoop底层维护多个数据副本，所以即使Hadoop某个计算元素或存储出现故障，也不会导致数据的丢失。
高扩展性：在集群间分配任务数据，可方便的扩展数以千计的节点。
高效性：在MapReduce的思想下，Hadoop是并行工作的，以加快任务处理速度。
高容错性：能够自动将失败的任务重新分配。

5.Hadoop的组成

在Hadoop1.x与Hadoop2.x

.在Hadoop1.x时代，Hadoop中的MapReduce同时处理业务逻辑运算和资源的调度，耦合性较大，在Hadoop2.x时代，增加了Yarn。Yarn只负责资源的调度，MapReduce只负责运算

版权声明：本博客为记录本人自学感悟，转载需注明出处！
https://me.csdn.net/qq_39657909

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。