hive
小强的进阶之路
这个作者很懒,什么都没留下…
展开
-
hive
数据管理hive的表本质就是hadoop的目录/文件,hive默认表存放路径一般都是在你的工作目录里面,按照表名做文件夹分开,如果有分区表的话,分区值是子文件夹,可以直接在其他的M/R job里直接应用这部分数据 hive支持4个数据模型:数据表 Table External Table分区表 Partition分桶表 Bucket...原创 2018-05-20 13:51:51 · 272 阅读 · 0 评论 -
hive、impala、prestoDB 优缺点对比
hive优点缺点被广泛应用,经受时间的考验既然是基于Mapreduce,也拥有MapReduce所有缺点,包含昂贵的Shuffle操作和磁盘IO操作运行在Mapreduce框架之上hive仍然不支持多个reduce操作group by和order by查询非常好的支持用户自定义函数和其他竞品相比,查询速度很慢很友好的和hbase等系统结合...原创 2018-11-26 16:29:07 · 4700 阅读 · 1 评论