Scala String.replaceALL() 替换 '\' 字符

Spark处理一批文本数据的时候,有的文本中存在'\'字符,在拼接Json字符串的时候会错误的将Json的 " 转义掉,这样会导致Json的解析异常,所以需要将'\'去掉,然后首先想到了下面的写法:

val str = """\哈哈哈\"""

// 注意,这是错误的写法!
str.replaceAll("""\""","")

结果出现了下面的异常:

Exception in thread "main" java.util.regex.PatternSyntaxException: Unexpected internal error near index 1
\
 ^
    at java.util.regex.Pattern.error(Pattern.java:1924)
    at java.util.regex.Pattern.compile(Pattern.java:1671)
    at java.util.regex.Pattern.<init>(Pattern.java:1337)
    at java.util.regex.Pattern.compile(Pattern.java:1022)
    at java.lang.String.replaceAll(String.java:2162)
    at com.neusoft.apps.Test$.main(Test.scala:37)
    at com.neusoft.apps.Test.main(Test.scala)

原因是:'\' 其实在正则表达式中依然是转移字符,虽然 """\""" 这种写法,在Scala中不需要转义就代表 '\' 字符,但是java.util.regex.Pattern中仍然将其视为转义符,而转义符后面没有跟待转义的字符,然后就报错了。
所以,转义符'\' 后再加上 '\' ,再进行一次转义才相当于字符 '\'

val str = """\哈哈哈\"""
str.replaceAll("""\\""","")

或者

val str = """\哈哈哈\"""
str.replaceAll("\\\\","")

同理,在String.split()方法中也是如此。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值