目前我有些文档要处理,出现如下的情况:
文本换行过多,需要把该在一行的文本弄成一行。行尾出现"。"、"?"、"!"这三个字符保留换行,其他的去掉换行。
现在使用正则进行替换:
得到的结果为:
这就是我想要的结果了。
正则表达式如下:
查找:
(?<=([^。?!]))$\r\n
替换:
(空白)
要特别注意有的行尾有空格,可以在正则表达式里处理掉 :
(?<=([^。?!]))\s*$\r\n
部分软件兼容性问题,可能出现无法实现,可能是换行符导致,换成这样就好了:
(?<=([^。?!]))\s*$\n