我刚在在notepad++中试过了,貌似它的正则表达式引擎是单字节的。用[\u4e00-\u9fa5]与[^\x00-\xff]都不能正常的匹配中文。实在是郁闷,在java、C#、JS里面编程都可以用“[\u4e00-\u9fa5]”来匹配中文的,于是想\u4e00不就是“一”,\u9fa5不就是“龥”吗?于是使用: [一-龥] 正常查找到所有的中文字。这时,中文标点符号没有匹配,加上[\uFF01-\uFF5E],即[!-~],完美解决。。。 于是得出,notepad++、UltraEdit中匹配中文的正则表达式为: [一-龥!-~]
注:EditPlus测试成功