大数据之旅--Hadoop的发展史

最新推荐文章于 2024-09-16 09:00:00 发布

FunnyPrince_

最新推荐文章于 2024-09-16 09:00:00 发布

阅读量1.2k

点赞数

分类专栏： # Hadoop 文章标签： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FunnyPrince_/article/details/117046875

版权

一、大数据概念：

大数据(Big Data)：指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合，是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

大数据主要解决：海量数据的采集、存储和分析计算问题。

数据存储单位(按从小到大的顺序)：bit、Byte、KB、MB、GB、TB、PB、EB、ZB、YB、BB、NB、DB。

二、大数据特点(4V)：

1.Volume(大量)： 很多大企业的数据量达到EB量级。

2.Velocity(高速)： 大数据区分于传统数据挖掘的最显著特征。根据IDC的“数字宇宙”的报告，预计到2025年，全球数据使用量将达到163ZB。在海量的数据面前，处理数据的效率对于企业来说就很重要了。
eg：天猫双十一：2020年96s，天猫交易额超过100亿。

3.Variety(多样)： 这种类型的多样性也让数据被分为结构化数据和非结构化数据。相对于以往便于存储的以数据库/文本为主的机构化数据，非结构化数据越来越多，包括网络日志、音频、
视频、图片、地理位置信息等，这些多类型的数据对数据的处理能力提出了更高要求。

4.Value(低价值密度)： 价值密度的高低与数据总量的大小成反比。

三、Hadoop

1. Hadoop是什么？</

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。