初试正则表达式

正则表达式

常用元字符

代码说明
.匹配除换行符以外的任意字符
\w匹配字母数字下划线汉字
\s匹配任意空白符
\d匹配任意数字
\b匹配单词的开始或结束
^匹配字符串的开始
$匹配字符串的结束
出现零次(不出现)或一次
+出现一次或者更多次

字符转义

代码说明
.\.
*\*
\\\

常用案例

输入输出(说明)
c:\\windowsc:\windows
baidu.combaidu.com
(010)88886666,或022-22334455,或02912345678(?0\d{2}[) -]?\d{8}
字符长度位5-12个随机数字^\d{5,12}$

分枝条件

不幸的是,刚才那个表达式也能匹配010)12345678或(022-87654321这样的“不正确”的格式。要解决这个问题,我们需要用到分枝条件。正则表达式里的分枝条件指的是有几种规则,如果满足其中任意一种规则都应该当成匹配,具体方法是用|把不同的规则分隔开。听不明白?没关系,看例子:

0\d{2}-\d{8}|0\d{3}-\d{7}这个表达式能匹配两种以连字号分隔的电话号码:一种是三位区号,8位本地号(如010-12345678),一种是4位区号,7位本地号(0376-2233445)。

\(0\d{2}\)[- ]?\d{8}|0\d{2}[-]?\d{8}这个表达式匹配3位区号的电话号码,其中区号可以用小括号括起来,也可以不用,区号与本地号间可以用连字号或空格间隔,也可以没有间隔。你可以试试用分枝条件把这个表达式扩展成也支持4位区号的。

\d{5}-\d{4}|\d{5}这个表达式用于匹配美国的邮政编码。美国邮编的规则是5位数字,或者用连字号间隔的9位数字。之所以要给出这个例子是因为它能说明一个问题:使用分枝条件时,要注意各个条件的顺序。如果你把它改成\d{5}|\d{5}-\d{4}的话,那么就只会匹配5位的邮编(以及9位邮编的前5位)。原因是匹配分枝条件时,将会从左到右地测试每个条件,如果满足了某个分枝的话,就不会去再管其它的条件了。

分组

怎么重复单个字符(直接在字符后面加上限定符就行了);但如果想要重复多个字符又该怎么办?你可以用小括号来指定子表达式(也叫做分组),然后你就可以指定这个子表达式的重复次数了,你也可以对子表达式进行其它一些操作(后面会有介绍)。

(\d{1,3}.){3}\d{1,3}是一个简单的IP地址匹配表达式。要理解这个表达式,请按下列顺序分析它:\d{1,3}匹配1到3位的数字,(\d{1,3}.){3}匹配三位数字加上一个英文句号(这个整体也就是这个分组)重复3次,最后再加上一个一到三位的数字(\d{1,3})。

反义

代码说明
\D匹配除数字外的字符
\W匹配除汉字字母数字下划线外的字符
\S匹配任意不是空白的字符串
\B匹配不是开头或结尾的位置
\[^x]匹配除了X以外的任意字符
[^aeiou]匹配除了aeiou这几个字母以外的任意字符

个人反思

  1. 数据库中 like 模糊查询和正则表达式的异同;
  2. mysql数据库中 使用 regexp 关键字通过正则表达式进行模糊查询,sqlserver是否试用;

[更新日期:20180628]


剩余参考文章:https://www.jb51.net/tools/zhengze.html

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值