1 csv格式(就是讲mysql表数据通过Sqlyog 导出时,默认的导出文件格式)
CSV格式的文件也称为逗号分隔值(Comma-Separated Values,CSV,有时也称为字符分隔值,因为分隔字符也可以不是逗号。在本文中的CSV格式的数据就不是简单的逗号分割的),其文件以纯文本形式存储表格数据(数字和文本)。CSV文件由任意数目的记录组成,记录间以某种换行符分隔;每条记录由字段组成,字段间的分隔符是其它字符或字符串,最常见的是逗号或制表符。通常,所有记录都有完全相同的字段序列。
1.1 导出后,可以指定导出时字符间隔(默认是\t)和字符包裹类型(可以不指定包裹类型), 如下图:
2 hive支持导入 .csv格式数据,步骤如下:
a)
导出后看导出样子,建议使用txt格式打开,这样可以看到字符的间隔,如果用excel打开,是看不到字符之间
是用你指定的字符还是用默认\t间隔的了,
这里我导出的文件用txt打开如下, 内容没用'' 包裹
12,1.71301E+15,23G,15589836997,20141201,2,532,13606343566,1,532,0,0,0,1,91,2
12,1.71207E+15,23G,18661866329,20141201,1,25,18952082990,3,25,0,2,0,1,31,1
12,1.71307E+15,23G,13026513953,20141201,1,530,15269099707,1,530,1,1,0,2,667,12
<