在Hive加载数据的时候,往往有些格式化的数据文件(比如txt,csv、excel等)的第一行都是字段名,这时候,我们就得跳过第一行去加载。因为Hive的数据文件不需要加载列名什么的。那么就得在创建表的时候就指定跳过第一行(加载数据的时候,跟往常还一样,不变)。下面是创建一个普通的Hive外部表
create external table student_ext (
sno int,
sname string,
sex string,
sage int,
sdept string
) row formatdelimited fields terminated by ',' location '/stu' ;
跳过第一行:使用tblproperties("skip.header.line.count"="1")
命令,就可以在加载数据的时候,跳过第一行
create external table student_ext (
sno int,
sname string,
sex string,
sage int,
sdept string
) row formatdelimited fields terminated by ',' location '/stu'
tblproperties("skip.header.line.count"="1");
如果要跳过N行,那么只要更改括号内的数字即可