今天在开发中,偶遇一解析CSV问题,涉及到String.split()函数使用,记录下来与大家分享。利用 split()将csv的一行数据,进行分割处理,是常见套路。但针对一下情况,使用split函数就会由于split的一些处理,导致处理问题。
例如以下例子,3个域分别是国家、省份和城市。但由于北京和上海是直辖市,所以最后一个字段没有值。在这种情况下,针对这两行调用split(","),生成的数组就只有2个元素,而不是我们希望的3个元素,当循环处理打印城市的时候,就很容易出现数组越界的问题。
中国,北京,
中国,河北,石家庄
中国,河南,曲阜
中国,上海,
这对这种情况,解决方法很简单,利用split()函数的变体,split(",", -1)即可。在split函数的java文档中,默认的处理情况是对于最后的无值字段,不进行处理直接忽略。如果采用变体,第二个参数是负数,如本例中的-1,则split将不忽略空值,连同空值都写入split生成的数组。
以下代码示例,展现了2种方式的处理结果。其中第一种方式,会导致数组越界,而第二种方式没有任何问题。
package cn.codenotes.java.splitcsv;
public class TestSplit {
// 模仿csv文件,但最后的一个字段,有些值为空
public static String[] csvContent = {
"中国,北京,",
"中国,河北,石家庄",
"中国,河南,曲阜",
"