1.大数据入门

最新推荐文章于 2024-04-20 15:35:12 发布

Miss Chim

最新推荐文章于 2024-04-20 15:35:12 发布

阅读量2k

点赞数 2

分类专栏： hadoop

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/Elrah/article/details/76864831

版权

1.什么是大数据？4V？大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据 = “海量数据”+“复杂类型的数据”。大数据的4V：Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据（big data），或称巨量数据、海量数据；是由数量巨大、结构复杂、类型众多数据构成的数据

摘要由CSDN通过智能技术生成

1. 什么是大数据？4V？

大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。

大数据 = “海量数据”+“复杂类型的数据”。

大数据的4V：Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。

大数据（big data），或称巨量数据、海量数据；是由数量巨大、结构复杂、类型众多数据构成的数据集合，是基于云计算的数据处理与应用模式，通过数据的集成共享，交叉复用形成的智力资源和知识服务能力。在商业领域指的是所涉及的资料规模巨大到无法透过目前主流软件工具，在合理时间内达到撷取、管理、处理、并整理成为帮助企业经营决策更积极目的的资讯。网络上每笔搜索，网站上每一笔交易，敲打键盘，点击鼠标的每一个输入都是数据，整理起来分析排行，不仅仅止于事后被动地了解市场，搜集起来的数据还可以引导开发更大的消费量。

2. 结构化和非结构化数据存储

SQL：

结构化存储，固定Schema
索引
标准化查询语言
ACID
扩展性弱

NoSQL：

Schema不固定，可以动态改变
没有固定查询语言
可以扩展到很大规模
高容错性
一般ACID在一个节点内，最终达到一致

3. 数据单位

8 bit = 1 Byte 一字节

1024 B = 1 KB （KiloByte）千字节

1024 KB = 1 MB （MegaByte）兆字节

1024 MB = 1 GB （GigaByte）吉字节

1024 GB = 1 TB （TeraByte）太字节

1024 TB = 1 PB （PetaByte）拍字节

1024 PB &

最低0.47元/天解锁文章

关注

2
点赞
踩
19

收藏

觉得还不错? 一键收藏
0
评论
1.大数据入门

1.什么是大数据？4V？大数据是指无法在一定时间内用常规软件工具对其内容进行抓取、管理和处理的数据集合。大数据 = “海量数据”+“复杂类型的数据”。大数据的4V：Volume(大量)、Velocity(高速)、Variety(多样)、Value(价值)。大数据（big data），或称巨量数据、海量数据；是由数量巨大、结构复杂、类型众多数据构成的数据
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。