在用sql loader做csv文件导入mysql时,偶然发现日志报了Row xxx doesn't contain data for all columns。mybatis xml sql语句如下:
<select id="importFile">
load data infile #{path} //csv文件的绝对路径
into table ${tableName} //要导入的mysql表名,注意用$
character set ${ctlCharaset} //csv文件的字符集对应sql loader的编码格式(csv是‘GBK’,这里传ZHS16GBK;csv是’UTF-8‘,这里传UTF8)
fields terminated by ','
optionally enclosed by '"'
lines terminated by '\r\n'
ignore 1 lines
(
${tableFileds} //csv文件的表头顺序字段,逗号隔开
);
</select>
检查发现是csv文件中有些单元格数据存的是转义字符‘\’,但我并没有在sql中添加escaped by语句,sql loader 读到这里的时候依然认为‘\’是转义符号而非一个字段值。查询资料发现load data infile语法在FIELDS子句,缺省会把'\'作为转义符号,即ESCAPED BY '\\'。于是,为了正确读取csv文件中的数据,在sql中添加escaped by '',测试后导入成功。
<select id="importFile">
load data infile #{path} //csv文件的绝对路径
into table ${tableName} //要导入的mysql表名,注意用$
character set ${ctlCharaset} //csv文件的字符集对应sql loader的编码格式(csv是‘GBK’,这里传ZHS16GBK;csv是’UTF-8‘,这里传UTF8)
fields terminated by ','
optionally enclosed by '"'
escaped by ''
lines terminated by '\r\n'
ignore 1 lines
(
${tableFileds} //csv文件的表头顺序字段,逗号隔开
);
</select>
总结:
1.在用sql loader时,如果源数据包含转义字符,则在sql指定其他转义;
2.mysql对一些特殊符号的处理不算友好,除了这里还有一些其他的问题,最好在前端用户输入的时候加特殊符号的校验拦截,这样会避免许多不必要的麻烦