一、表名如果以数字开头,执行sql语句时需要加反向引号
SELECT * from tmp.20220915_online_pd
会报错如下:
AnalysisException: Syntax error in line 1:
SELECT * from tmp.20220915_online_pd
^
CAUSED BY: Exception: Syntax error
需要改为如下即可:
SELECT * from tmp.`20220915_online_pd`
二、时间戳转换(impala语法)
- date 转 时间戳 (eg:2019-01-01 00:00:00 -> 1546272437000)
unix_timestamp(created_at) * 1000 - 8 * 3600 * 1000
- 时间戳 转 date (eg:1546272437000 -> 2019-01-01 00:00:00)
from_unixtime(CAST(created_at /1000+8*3600 as bigint),'yyyy-MM-dd HH:mm:ss')
备注:impala和hive的时区不同。hive不必使用 + 8*3600
三、有些文章含有回车符,如何在sql语句中替换为空
REGEXP_REPLACE(text, "\n|\r|\0", "") as clean_text,