项目有提供一个excel导入订单的功能给客户使用,工具类里面有自动去除空格的方法。但奇怪的是,发现居然有个条码空格过滤失效。
将该条码放到网址 https://www.sojson.com/ascii.html 下转换ASCII编码,发现
\u00a0应该属于unicode编码,用\r \n 等方式无法替换空格,可通过以下方法替换
dest = dest.replaceAll("[\\pZ]", "");
以下参考
\pP 其中的小写 p 是 property 的意思,表示 Unicode 属性,用于 Unicode 正表达式的前缀。
大写 P 表示 Unicode 字符集七个字符属性之一:标点字符。
其他六个是
L:字母;
M:标记符号(一般不会单独出现);
Z:分隔符(比如空格、换行等);
S:符号(比如数学符号、货币符号等);
N:数字(比如阿拉伯数字、罗马数字等);
1.不间断空格\u00A0,主要用在office中,让一个单词在结尾处不会换行显示,快捷键ctrl+shift+space
2.半角空格(英文符号)\u0020,代码中常用的;
3.全角空格(中文符号)\u3000,中文文章中使用;
其他
Pattern p = Pattern.compile("\\pZ*\\s*|\t|\r|\n");
Matcher m = p.matcher(dest);
dest = m.replaceAll("");
\n 回车(\u000a)
\t 水平制表符(\u0009)
\s 空格(\u0008)
\r 换行(\u000d)