Hive
同道大叔
这个作者很懒,什么都没留下…
展开
-
MaxCompute常用时间周期SQL
近3年、近1年、近6月、近3月、近1月。:去年、本年、上月、本月、上周、本周。原创 2024-08-02 10:52:27 · 95 阅读 · 0 评论 -
file hdfs:// does not exist.
select mid_id from dws_uv_detail_day where dt <= '2020-07-04' group by mid_id这是一张外部表,做查询时发现有过往元数据未清除,报了file hdfs:// 文件 does not exist.,找不到被删除的数据。解决方式drop table把元数据删了,然后又重新建了这张表,把数据同步到外部表就行了load data inpath '/warehouse/gmall/dws/d原创 2020-07-06 17:20:46 · 3112 阅读 · 0 评论 -
No LZO codec found, cannot run.
直接Hive启动执行select语句无异常,但使用JDBC方式连接Hiveserver2报如下错误0: jdbc:hive2://hadoop102:10000> select * from ods_start_log limit 10;Error: java.io.IOException: java.io.IOException: No LZO codec found, cannot run. (state=,code=0尝试方法: 首先将hadoop-lzo-0.4.20.jar 放入Ha原创 2020-07-05 01:39:05 · 982 阅读 · 5 评论 -
常见Hive SQL操作的执行过程
1、joinSELECT pv.pageid, u.ageFROM page_view pv JOIN user u ON pv.userid = u.userid ;实现过程:1)Map:以 JOIN ON 条件中的列作为 Key,如果有多个列,则 Key 是这些列的组合以 JOIN 之后所关心的列作为Value,当有多个列时,Value 是这些列的组合。在 Value ...原创 2020-02-21 17:52:31 · 168 阅读 · 0 评论