java忽略引号中的分隔符_Java:拆分逗号分隔的字符串但忽略引号中的逗号

尝试:

public class Main {

public static void main(String[] args) {

String line = "foo,bar,c;qual=\"baz,blurb\",d;junk=\"quux,syzygy\"";

String[] tokens = line.split(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)", -1);

for(String t : tokens) {

System.out.println("> "+t);

}

}

}

输出:

> foo

> bar

> c;qual="baz,blurb"

> d;junk="quux,syzygy"

换句话说:只有在逗号前面有零个或偶数个引号时,才在逗号上拆分

或者,对眼睛更友好一点:

public class Main {

public static void main(String[] args) {

String line = "foo,bar,c;qual=\"baz,blurb\",d;junk=\"quux,syzygy\"";

String otherThanQuote = " [^\"] ";

String quotedString = String.format(" \" %s* \" ", otherThanQuote);

String regex = String.format("(?x) "+ // enable comments, ignore white spaces

", "+ // match a comma

"(?= "+ // start positive look ahead

" (?: "+ // start non-capturing group 1

" %s* "+ // match 'otherThanQuote' zero or more times

" %s "+ // match 'quotedString'

" )* "+ // end group 1 and repeat it zero or more times

" %s* "+ // match 'otherThanQuote'

" $ "+ // match the end of the string

") ", // stop positive look ahead

otherThanQuote, quotedString, otherThanQuote);

String[] tokens = line.split(regex, -1);

for(String t : tokens) {

System.out.println("> "+t);

}

}

}

其结果与第一个示例相同

正如@MikeFHay在评论中提到的:

我更喜欢用Guava’s Splitter,因为它有更合理的默认值(参见上面关于空匹配被String\split()修剪的讨论),所以我做了:

Splitter.on(Pattern.compile(",(?=(?:[^\"]*\"[^\"]*\")*[^\"]*$)"))

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值