Hadoop-大数据引言

1. 什么是大数据?
对大量的数据集文件处理的过程,称之为大数据(TB级以上)
大量数据集:b—k---M—G---T—PB—EB—ZB 换算单位:1024
2. 为什么是大数据?
通过对海量数据进行统计分析,从而在这些分析和统计过程中找出内在规律,从而伪国家和企业创造价值
3. 大数据特点?
4v特征
1.Volume(大量) 数据集非常大 TB级以上||如果数据增长在每天/GB级
2.Variety(多样) 数据格式多样 非格式化:音频,视频 半结构:json,mongdb
3.Velocity(快速) 数据处理一定快
4.Value(价值)
4. 大数据核心处理的数据类型:文本类型
5. 大数据的来源
1.ngxin的用户访问日志 系统运行日志 系统运行过程中数据库中数据
2.爬虫
3.行业数据
6. 大数据今天面临的问题?
1.大数据存储问题
2.大数据的计算问题

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

文文鑫

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值