![](https://img-blog.csdnimg.cn/20201014180756926.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
Hive
文章平均质量分 83
qianmoQ
做一名低调的程序猿
展开
-
构建一个优秀的SQL及优化方案
必要的查询字段 由于存储的特性,选择需要的字段可加快字段的读取、减少数据量。避免采用*读取所有字段。 一般再CTE模式中这种风险不是很明显 为什么要避免使用*?它带来的风险? 它会增加查询分析SQL的成本(在数据库需要解析更多的对象、字段、权限、属性等相关内容,在复杂SQL语句,硬解析较多的情况下,会对服务造成沉重的负担) 网络以及IO开销增长(*查询时会误带上非必要的数据,如log、IconMD5等之类的无用且超大文本字段,数据传输会几何增涨。如果服务和应用程序不在同一台机器,这种开销会急剧增原创 2022-03-17 11:38:58 · 1300 阅读 · 0 评论 -
Hive On Tez自定义Job Name
今天在使用Hive On Tez的时候发现一个问题,那就是我们无法设置Tez运行在Yarn上面的Job Name。按照设置MR正常的步骤来设置Job Name发现也是无效的。 这让我很迷惑,于是想了一下是不是因为TezSession的时候已经写死了导致的,然通过将Hive的源码下载下来(我用的是Hive-3.1.2的源码,下载地址:https://mirror.bit.edu.cn/apache/hive/hive-3.1.2/apache-hive-3.1.2-src.tar.gz) 将源码下载以后,按照原创 2020-09-24 21:27:49 · 15478 阅读 · 7 评论