事件经过:
在hive中编写了一段sql,其作用是对某个字段以‘|’ 进行切割,达成一行变多行的效果,但总是执行完成的结果与预期的不一样。切割的字符结果变成了单个字符,此时需要对‘1’进行字符转义(使用‘\’)。使用双斜杠后(‘\|’),发现在hive里直接执行时没问题,但在执行sql文件的时候却转义失败了(hive -f xxx.sql),结果还是单个字符。此时需要对‘|’进行第二次转义(‘\\|’),转义后即可正常切割,得到想要的数据结果。可问题又来了,在python里调用os模块执行hive -f xxx.sql,转义又失败了,此时需要对‘|’进行第三次转义(‘\\\|’),再执行python文件即可。
引出问题
为什么第一次在hive里面执行只需要一次转义,在linux中执行hive -f xxx.sql 或者 hive -e ‘*****’ 却要两次转义,在python里执行,要三次转义?
个人理解
在hive中为什么需要一次转义?
由于‘|’是转义字符,所以需要转义符(‘\’)
在linux中执行为什么需要两次转义?
在hive里转义是给hive平台用的,再加一层转义是给linux用的。同理在python执行需要多加一层转义,因为它需要经过python、linux、hive三个平台,每个平台都要转义一次!