正则表达式基础语法
在对正则表达式的功能和作用有了初步的了解之后,我们就来具体看一下正则表达式的语法格式。
正则表达式的形式一般如下:
/love/
其中位于―/‖定界符之间的部分就是将要在目标对象中进行匹配的模式。用户只要把希望查找匹配对象的模式内容放入―/‖定界符之间即可。为了能够使用户更加灵活的定制模式内容,正则表达式提供了专门的―元字符‖。所谓元字符就是指那些在正则表达式中具有特殊意义的专用字符,可以用来规定其前导字符(即位于元字符前面的字符)在目标对象中的出现模式。
较为常用的元字符包括: ― ‖, ―‖,以及 ―?‖。其中,― ‖元字符规定其前导字符必须在目标对象中连续出现一次或多次,―‖元字符规定其前导字符必须在目标对象中出现零次或连续多次,而―?‖元字符规定其前导对象必须在目标对象中连续出现零次或一次。 下面,就让我们来看一下正则表达式元字符的具体应用。
/fo /
因为上述正则表达式中包含― ‖元字符,表示可以与目标对象中的 ―fool‖, ―fo‖, 或者 ―football‖等在字母f后面连续出现一个或多个字母o的字符串相匹配。
/eg*/
因为上述正则表达式中包含―*‖元字符,表示可以与目标对象中的 ―easy‖, ―ego‖, 或者 ―egg‖等在字母e后面连续出现零个或多个字母g的字符串相匹配。
/Wil?/
因为上述正则表达式中包含―?‖元字符,表示可以与目标对象中的 ―Win‖, 或者 ―Wilson‖,等在字母i后面连续出现零个或一个字母l的字符串相匹配。 除了元字符之外,用户还可以精确指定模式在匹配对象中出现的频率。例如,
/jim{2,6}/
上述正则表达式规定字符m可以在匹配对象中连续出现2-6次,因此,上述正则表达式可以同jimmy或jimmmmmy等字符串相匹配。
元字符的使用方法
\s:用于匹配单个空格符,包括tab键和换行符;
\S:用于匹配除单个空格符之外的所有字符;
\d:用于匹配从0到9的数字;
\w:用于匹配字母,数字或下划线字符;
\W:用于匹配所有与\w不匹配的字符;
. :用于匹配除换行符之外的所有字符。
/\s /
上述正则表达式可以用于匹配目标对象中的一个或多个空格字符。
/\d000/
如果我们手中有一份复杂的财务报表,那么我们可以通过上述正则表达式轻而易举的查找到所有总额达千元的款项。
正则表达式替换技巧
正则表达式应用——替换指定内容到行尾
原始文本如下面两行
abc aaaaa
123 abc 444
希望每次遇到“abc”,则替换“abc”以及其后到行尾的内容为“abc efg”
即上面的文本最终替换为:
abc efg
123 abc efg
解决方法:
同时勾选“正则表达式”复选框,然后点击“全部替换”按钮
其中,符号的含义如下:
“.” =匹配任意字符
“*” =匹配0次或更多
正则表达式应用——
删除每一行行尾的指定字符
这几个字符在行中也是出现的,所以肯定不能用简单的替换实现 比如
12345 1265345
2345
需要删除每行末尾的“345” 这个也算正则表达式的用法,其实仔细看正则表达式应该比较简单,不过既然有这个问题提出,说明对正则表达式还得有个认识过程,解决方法如下
解决: 在替换对话框中,启用“正则表达式”复选框 在查找内容里面输入“345
”
这
里
“
” 这里“
” 这里“”表示从行尾匹配
如果从行首匹配,可以用“^”来实现,不过 EditPlus 有另一个功能可以很简单的删除行首的字符串
a. 选择要操作的行
b. 编辑-格式-删除行注释
c. 在弹出对话框里面输入要清除的行首字符,确定