正则表达式 (UltraEdit Syntax):
% 匹配行首 - 表明要搜索的字符串一定在行首.
$ 匹配行尾 - 表明要搜索的字符串一定在行尾
? 匹配除换行符外的任一单个字符.
* 匹配任意个数的字符出现任意次数(不包括换行符)
+ 匹配前导字符或者表达式出现一次或者更多次(不包括换行符)
++ 匹配前导字符或者表达式不出现或者出现一次以上(不包括换行符)
^b 匹配页中断符
^p 匹配DOS文件的换行符
^r 匹配MAC文件的换行符(CR Only)
^n 匹配UNIX文件的换行符 (LF Only)
^t 匹配一个制表符
[ ] 匹配方括号中的单个的字符
查找所有的数字: [0-9]+[.]++[0-9]+
查找所有的单词: [a-z]+
查找所有的网址: http://[a-z0-9^~`_./^-^?=&]+
查找所有的汉字: [^一-龥],不过需要注意按照以下步骤操作:
1、查询后的汉字,如果乱码或者空白,另存为“UTF-16”格式的文本,再次查找就正常了。
2、选择Unix风格的正则表达式。方法:高级——配置——搜索——正则表达式,选中“Unix风格正则表达式”。
3、高级——设置代码页/本地,“系统中已安装的代码页”,选择“936(ANSI/OEM-简体中文GBK)”;“系统已安装的地区”选择"中文(中国)中国人们共和国"。
删除空行: 替换 %[ ^t]++^p 为 空串
删除行尾空格: 替换 [ ^t]+$ 为 空串
删除行首空格: 替换 %[ ^t]+ 为 空串
每行设置为固定的4个空格开头: 替换 %[ ^t]++^([~ ^t^p]^) 为 " ^1"
每段设置为固定的4个空格开头: 替换 %[ ^t]+ 为 " "
(如果一行是以空格开始的,则视之为一段的开始行)
将一段合并为一行: 替换 [ ^t]++^p^([~ ^t^p]^) 为 ^1
(注意: 此处假定文本是以DOS方式回车换行 - CR/LF)
去掉HTML TAG: 替换 ^{<*>^}^{<*^p*>^} 为 空串
删除HTML中的所有: 替换 <[ ]++a *[ ]++href[ ]++=*> 为 空串
删除文本中指定的前2列字符: 替换 %?? 为 空串
在第4列后插入2列空白字符: 替换 %^(????^)^(?^) 为 "^1 ^2"
UltraEdit 中替换部分字符串的正则表达式 TE TE>
在UE中可以以下面的方式替换:
FIND:strcpy^(*^)Text.c_str()
REPLACE:bcscpy^1Text
说明:
^(*^)表示取strcpy之后Text之前的内容,结果存在^1中。这样就可以将希望保留的内容存下来,而将其他内容替换掉
最后附表如下:
表1.常用的特殊代码 代码/语法 说明
. 匹配除换行符以外的任意字符
\w 匹配字母或数字
\s 匹配任意的空白符
\d 匹配数字
\b 匹配单词的开始或结束
^ 匹配字符串的开始
$ 匹配字符串的结束
表2.常用的量词 代码/语法 说明
* 重复零次或更多次
+ 重复一次或更多次
? 重复零次或一次
{n} 重复n次
{n,} 重复n次或更多次
{n,m} 重复n到m次
表3.常用的反义代码 代码/语法 说明
\W 匹配任意不是字母和数字的字符
\S 匹配任意不是空白符的字符
\D 匹配任意非数字的字符
\B 匹配不是单词开头或结束的位置
[^x] 匹配除了x以外的任意字符
[^aeiou] 匹配除了aeiou这几个字母以外的任意字符