大数据的数据不可修改
hive不是数据库 是个数仓系统 对数据统计聚合的
hbase表现出修改实际上 重新写了一条数据
应用程序中表现新的数据其实是写了一个新的数据 起了一个新的版本号 在默认情况下 查询的是最新版本号
hive在对数据进行聚合统计的时候 跑的都是mapreduce 在写或者更新的时候跑的也是mapreduce 速度都是很慢的 而hive不做聚合统计 只做条件筛选的时候速度是很快的 (select不group by)
↑数据存储方面的
↓数据计算方面的
mapreduce 分布式计算 分为两个阶段
2.11复习
最新推荐文章于 2023-11-11 14:12:20 发布