
Hive
文章平均质量分 62
Mine_Cun
这个作者很懒,什么都没留下…
展开
-
Hive的特点、架构、数据模型等介绍
Hive的定义:Hive是建立在 Hadoop 上的数据仓库基础构架。提供了一系列的工具,可以用来进行数据提取转化加载(ETL),这是一种可以存储、查询和分析存储在 Hadoop 中的大规模数据的机制。 Hive的特点:Hive 不适合那些需要低延迟的应用,例如,联机事务处理(OLTP),设计模式遵循联机分析处理(OLAP)Hive 不提供实时查询和基于行级的数据更新操作...原创 2018-08-21 23:53:30 · 3126 阅读 · 0 评论 -
Hadoop子项目Hive,你不得不知道的小知识
Hive的优化方法:1、join连接时的优化:当三个或多个以上的表进行join操作时,如果每个on使用相同的字段连接时只会产生一个mapreduce。2、join连接时的优化:当多个表进行查询时,从左到右表的大小顺序应该是从小到大。原因:hive在对每行记录操作时会把其他表先缓存起来,直到扫描最后的表进行计算3、在where字句中增加分区过滤器。4、当可以使用left semi j...原创 2018-09-06 22:04:14 · 322 阅读 · 0 评论