第一章 初识hadoop

容量的单位

顺序:从小到大

1024

MB->GB->TB->PB->EB->ZB->YB


名言:大数据胜于好算法


大数据真实需求案例:邮件公司日志,每月运行一个mapreduce,任务帮助公司决定在哪些Rackspace数据中心需要添加新的服务器


硬盘操作的延迟主要受两方面影响:

1、寻址时间:将磁头移动到特定的硬盘位置进行读写操作的过程

2、传输速率,取决于硬盘的带宽,eg:固态硬盘和普通硬盘


关系型数据库和mapreduce的比较
 传统关系数据库MapReduce
数据大小GBPB
数据存储交互式和批处理批处理
更新多次读/写一次写入,多次读取
结构静态模式动态模式
完整性
横向扩展非线性线性

结构化数据:有类型有数据,比如JAVA String a= 1;eg:XML数据

半结构数据:有数据无类型,比如PHP $a = 1;eg:Excel数据

非结构数据:无内部结构纯文本图片

Hadoop发展史

名字是飞象,小朋友起的名字,好拼写,含义宽泛,易于传播

hadoop在雅虎 腾飞

版本1.x ,0.22,2.x




评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值