kaukiyou的专栏

Fighting can be so exciting!

Java正则表达式替换移除空行和多余的空格

这几天重拾Java写代码,需要操作文本文件中的内容。

最终,要把内容里的空行和多余的连续空格移除,使用String里的replace或者replaceAll,试了很多次都没有成功。

最后发现需要使用正则表达式Regex。先把解决方案共享如下。

1. 移除多余的连续空格,只留下一个空格。

string.replaceAll("\\s{2,}", " ");

比较简单\\s代表空格,使用贪婪表达式,如果是2个或多个空格,则替换为空格。

续,实践中发现不工作原来\\s不光代表空格,是等于[ \t\n\x0B\f\r]

\\p{Blank}{2,} 则是A space or a tab

更简单的 string.replaceAll("[ ]+", " ");


2. 移除空行

string.replaceAll("(?m)^\\s*$"+System.lineSeparator(), "");

?m开启多行模式,^是行开始,\\s*代表任意个空格,$代表行结束,System.lineSeparator()则是为了跨平台的换行符。

故所有空行包括只含有空格的空行都会被替换为空字符串,即被移除。


考虑到不同平台的文件存在混用的情况,可以改进为 string..replaceAll("(?m)^\\s*$(\\n|\\r\\n)", "");


3. 替换字符串中的唯一子字符串,如果子字符串含有正则表达式字符,则替换不成功。

可以考虑自己写一个方法实现。

public String removeString(String str, String old) {
int i = str.indexOf(old);
if (i >= 0) {
return str.substring(0, i) + str.substring(i + old.length());
}
return str;
}


综上, 希望可以帮到大家。

阅读更多
个人分类: Java Home
想对作者说点什么? 我来说一句

没有更多推荐了,返回首页

加入CSDN,享受更精准的内容推荐,与500万程序员共同成长!
关闭
关闭