原因可能是没有使用别名,养成良好的SQl习惯就可以避免犯错误。
报错类型ERROR operation.ExecuteStatement: Error operating EXECUTE_STATEMENT: org.apache.spark.sql.AnalysisException: cannot resolve '.......' given input columns
with zibiao as (SELECT dt
,wrapper_name
,uid
,datediff(checkout_date,checkin_date)
FROM 表1
)
SELECT dt
,wrapper_name
,uid,
datediff(checkout_date,checkin_date)
from zibiao
在上述代码当中子表从表1当中查询出来 并去计算出两天的一个实际差值,datediff(checkout_date,checkin_date),但是这个并不是这一列数值的名称,
在对表1进行嵌套查询的时候如果把 datediff(checkout_date,checkin_date) 当作列的名称是会出现下面这种报错的
ERROR operation.ExecuteStatement: Error operating EXECUTE_STATEMENT: org.apache.spark.sql.AnalysisException: cannot resolve 'checkout_date' given input columns
其实我们要明白一点就能解决这个问题,对于查询出来的结果如上图,虽然列名是 datediff(checkout_date,checkin_date) ,但是如果在嵌套查询时候使用datediff(checkout_date,checkin_date)就不行,比较简单的解决方案是取个别名,在查询的时候使用别名就不会出问题了
with zibiao as (SELECT dt
,wrapper_name
,uid
,datediff(checkout_date,checkin_date) `取的别名`
FROM 表1
)
SELECT dt
,wrapper_name
,uid,
`取的别名`
from zibiao