一.Hadoop简介
1.hadoop存在的价值
海量数据分析->分布式存储,分析
2.分布式存储的问题
(1)硬件故障--冗余磁盘阵列的工作方式,Hadoop的HDFS
(2)如何保证数据合并后的正确性,MapReduce
3.与其他系统比较
(1)hadoop应用场景
Rackspace 数百G邮件日志分析,查询用户的地理分布。
(2)与关系型数据库管理系统比较
数据库查询速度比hadoop快,因为数据的访问模式受限于磁盘的寻址
数据库update比hadoop慢,因为需要使用排序/合并重建数据库
MapReduce思路
(3)网格计算
二.MapReduce简介
Hadoop学习笔记
最新推荐文章于 2024-07-28 16:45:11 发布