hive
大道独行之BIGDATA
人生充满着期待,梦想连接着未来
展开
-
SQL万能模板之七步剖析--适合小白快速入门
SQL万能模板之七步剖析–适合小白快速入门SQL模板select 1 from 2 where 3 group by 4 having 5 order by 6 limit 71-决定了结果有哪些列:对数据源中数据列的过滤2-决定了查询数据的数据源是什么表、视图、join、子查询3-决定了对数据源中数据行的过滤:分组前的行的过滤4-决定了按照哪一列的值进行分组:一般都会搭配聚合函数在group by语句中,1位置中的列要么是分组的字段,要是是聚合函数的结果5-决定了对分原创 2020-12-02 11:36:11 · 2766 阅读 · 3 评论 -
hive优化基础1
1.hive优化基础1开启分桶 set hive.enforce.bucketing=true;设置reduce个数 set mapreduce.job.reduces=3;hive表 ->orc和parquet -->ZLIB或snappy Parquet是面向分析型业务的列式存储格式fetch抓取: 在全局找、字段查找、limit查找等都不走mapreduce. set hive.fetch.task.conversion=more;默认为 none.本地模式 :a.原创 2020-12-02 10:38:39 · 1927 阅读 · 0 评论