问题
今天写 SQL 的时候遇到一个问题,就是使用 split() 函数时,分隔符用 ;
就会报错,语句如下:
select split(str, ';');
报错如下:
Error while compiling statement: FAILED: ParseException line 1:17 cannot recognize input near '<EOF>' '<EOF>' '<EOF>' in select expression
一开始以为是转义字符的问题,但是无论是使用 '\;'
,还是 '\\;'
,或者将单引号 ''
换为双引号 ""
,都是不行的,然后上网查了一些资料,说 Hive 解析语句的时候,只要遇到分号就认为语句结束,无论是否用引号包含起来,还是是否使用转义字符,其对分号的识别是没有那么智能,都会将语句识别为 select split(str, ';
,这样就导致 SQL 不完整了,所以才会报错。
解决方法
解决的办法是,使用分号的八进制
的 ASCII 码(分号十进制的 ASCII 码为 59)进行转义,那么上述语句应写成:
select split(str, '\073');
如 CREATE TABLE 中需要定义分隔符,那么对不可见字符做分隔符就需要用八进制的 ASCII 码来转义。