【Java】清洗字符串中的标点符号
去除字符串中的所有标点符号
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:符号(比如数学符号、货币符号等);
N:数字(比如阿拉伯数字、罗马数字等);
C:其他字符
string.replaceAll("[\\pP‘’“”]", "");
使用示例
String s1="我的宿舍:位于河南省,新乡市牧野区,建设东区46号,河南师范大学,东校区,东16号学生公寓";
System.out.println(new JiebaSegmenter().sentenceProcess(s1.replaceAll("[\\pP‘’“”]", "")));
清洗结果