![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
hive
ら.二十一
这个作者很懒,什么都没留下…
展开
-
hive笔记
1、HIve是什么? HIve是基于Hadoop的数仓解决方案。由于Hadoop本身在数据存储和计算方面有很好的可扩展性和高容错性,因此使用Hive构建的数仓也秉承了这些特性。 其实Hive就是在Hadoop上添加了一层sql接口,可以将sql翻译成MapReduce在Hadoop上执行,使得数据开发和数据分析人员很方便的使用SQL来完成海量数据的统计和分析。 2、HIve擅长什么? Hive可以...原创 2019-04-07 23:21:45 · 197 阅读 · 0 评论 -
hive小记
hive培训 hive 目前最好用的大数据sql引擎 cascade关键字 百度查询。 hive的common join map join 速度快,数据量过大时容易报错。 HQL的优化 尽量多使用分区键 带分区条件的时候,将分区条件放在on中 或者使用子查询 hive尽量少用count(distinct[column]) 由于这个操作会用一个reduce task操作,这个reduce处理的...原创 2019-04-07 23:26:24 · 163 阅读 · 0 评论