最近遇到个问题,hive 查出来的数据的分隔符是tab,想把它导入到其它的表里面,其它的表的数据的分隔符是linux的默认分隔符,找了如下方法做替换。
下面是每行被四个分隔符 \t 分割的文件的替换
awk -F '\t' '{print $1,$2,$3,$4,$5}' OFS='\001' 原始文件名 > 结果文件名
字段个数要根据实际情况调整下哦!
最近遇到个问题,hive 查出来的数据的分隔符是tab,想把它导入到其它的表里面,其它的表的数据的分隔符是linux的默认分隔符,找了如下方法做替换。
下面是每行被四个分隔符 \t 分割的文件的替换
awk -F '\t' '{print $1,$2,$3,$4,$5}' OFS='\001' 原始文件名 > 结果文件名
字段个数要根据实际情况调整下哦!