正则表达式,看我就懂

 

2018年11月01日 18:15:23 Dwyane_Coding 阅读数:35

版权声明:本文为博主原创文章,未经博主允许不得转载。 https://blog.csdn.net/wojiaoweide/article/details/83624798

世界上分为两种人,一种是懂正则表达式的,一种是不懂正则表达式的。

不管你学的是什么语言,Java,iOS,安卓,都需要用到正则表达式,又因为正则表达式相通(每种语言几乎一样),所以在哪种语言学会正则,都可以用到其他语言中,下面我以python为例。

文末,有常用正则表达式

什么是正则表达式:

1、通俗理解:按照一定的规则,从某个字符串中匹配出想要的数据。这个规则就是正则表达式。
2、标准答案:https://baike.baidu.com/item/正则表达式/1700215?fr=aladdin

正则表达式常用匹配规则:

匹配某个字符串:

text = 'hello'
ret = re.match('he',text)
print(ret.group())
# he
  • 1
  • 2
  • 3
  • 4

点(.)匹配任意的字符

text = '+hello'
ret = re.match('.',text) # 只匹配一个任意字符,但不可以匹配换行(\n)符号
print(ret.group())
> +
  • 1
  • 2
  • 3
  • 4

\d匹配任意的数字:

text = "8"
ret = re.match('\d', text)
print(ret.group())
# 8
  • 1
  • 2
  • 3
  • 4

\D匹配任意的非数字:

text = "-"
ret = re.match('\D', text)
print(ret.group())
# -
  • 1
  • 2
  • 3
  • 4

\s匹配的是空白字符(包括:\n,\t,\r和空格):

text = "\t"
ret = re.match('\s',text)
print(ret.group())
  • 1
  • 2
  • 3

\w: 匹配的是 a-z,A-Z,数字和下划线:

text = "b"
ret = re.match('\w',text)
print(ret.group())
# b
  • 1
  • 2
  • 3
  • 4

\W匹配的是和\w相反的:

text = "+"
ret = re.match('\W',text)
print(ret.group())
# +
  • 1
  • 2
  • 3
  • 4

[]组合的方式,只要满足中括号中的某一项都算匹配成功:

text = 'b'
ret = re.match('[a1b]',text)
print(ret.group())
# b
  • 1
  • 2
  • 3
  • 4

之前讲到的几种匹配规则,其实可以使用中括号的形式来进行替代:

  • \d:[0-9]
  • \D:[0-9]
  • \w:[0-9a-zA-Z_]
  • \W:[^0-9a-zA-Z_]

*:可以匹配0或者多个字符

text = "3a1bcd"
ret = re.match("\d*", text)
print(ret.group())
# 3
  • 1
  • 2
  • 3
  • 4

+:可以匹配1或者多个字符

text = "13ab6cd"
ret = re.match("\d+", text)
print(ret.group())
# 13
  • 1
  • 2
  • 3
  • 4

?:匹配一个或0个,要么没有,要么只有一个

text = "234"
ret = re.match("\w?", text)
print(ret.group())
# 2
  • 1
  • 2
  • 3
  • 4

{m}:匹配m个字符

text = "234ab"
ret = re.match("\d{2}", text)
print(ret.group())
# 23
  • 1
  • 2
  • 3
  • 4

{m,n}:匹配m-n个字符。在这中间的字符都可以匹配到

text = "2d34absds124"
ret = re.match("\w{1,4}", text)
print(ret.group())
# 2d34
  • 1
  • 2
  • 3
  • 4

search函数

text = "adX"
ret = re.search("d",text)
print(ret.group())
# d
  • 1
  • 2
  • 3
  • 4

^ (脱字号) :以什么开头,在macth函数中可以省略,效果一样,在 search 函数不可省略

text = "adX"
ret = re.match("^a",text)
print(ret.group())
  • 1
  • 2
  • 3

$:表示以…结束:

text = "xxx@163.com"
ret = re.match("\w+@163.com$",text)
print(ret.group())
  • 1
  • 2
  • 3

其他补充

search:在字符串中找满足条件的字符。如果找到,就返回。说白了,就是只会找到第一个满足条件的。

text = 'apple price $99 orange price $88'
ret = re.search('\d+',text)
print(ret.group())
# 99

text = "adX"
ret = re.search("d",text)
print(ret.group())
# d
  • 1
  • 2
  • 3
  • 4
  • 5
  • 6
  • 7
  • 8
  • 9

$ 表示以什么结尾

text = "xxx@163.com"
ret = re.match("\w+@163.com$",text)
print(ret.group())
# xxx@163.com
  • 1
  • 2
  • 3
  • 4

|:匹配多个表达式或者字符串:

text = "hello|world|love"
ret = re.search('love',text)
print(ret.group())
# love
  • 1
  • 2
  • 3
  • 4

贪婪模式

text = "0123456"
ret = re.match('\d+',text)
print(ret.group())
# 0123456
  • 1
  • 2
  • 3
  • 4

可以改成非贪婪模式,那么就只会匹配到0

text = "0123456"
ret = re.match('\d+?',text)
print(ret.group())
# 0
  • 1
  • 2
  • 3
  • 4

匹配0-100之间的数字:

text = '99'
ret = re.match('[1-9]?\d$|100$',text)  # 记得有个 $ 结尾
print(ret.group())
# 99
  • 1
  • 2
  • 3
  • 4

转义字符和原生字符串:

1、 不用原生字符串,则需要4个 \ 因为 python中 “\n” = \n, 正则表达式中 “\n” = \n,所以 “\\m” => \n

 text = "apple \c"
 ret = re.search('\\\\c',text)
 print(ret.group())
# \c
  • 1
  • 2
  • 3
  • 4

2、原生字符串 r = raw = 原生的

text = "apple \c"
ret = re.search(r'\\c',text)  # 相当于这层pyhton不会将字符进行转义,只有正则表达式的转义,所以 =》 \c
print(ret.group())
# \c
  • 1
  • 2
  • 3
  • 4

小案例

1、验证手机号码:手机号码的规则是以1开头,第二位可以是34587,后面那9位就可以随意了

text = "18820898963"
ret = re.match("1[34578]\d{9}", text)
print(ret.group())
  • 1
  • 2
  • 3

2、验证邮箱:邮箱的规则是邮箱名称是用数字、数字、下划线组成的,然后是@符号,后面就是域名了

text = "dwyane@163.com"
ret = re.match("\w+@[a-z0-9]+\.[a-z]+",text)
print(ret.group())
  • 1
  • 2
  • 3

3、验证URL:URL的规则是前面是http或者https或者是ftp然后再加上一个冒号,再加上一个斜杠,再后面就是可以出现任意非空白字符了

text = "https://www.jianshu.com/u/bb2db3428fff"
ret = re.match("(http|https|ftp)://[^\s]+",text)   # [^\s] 非空白符
print(ret.group())
  • 1
  • 2
  • 3

4、验证身份证:身份证的规则是,总共有18位,前面17位都是数字,后面一位可以是数字,也可以是小写的x,也可以是大写的X

text = "44010319900307883X"
ret = re.match("\d{17}[\dxX]",text)
print(ret.group())
  • 1
  • 2
  • 3

5、验证用户名(用户名长度为6-20位之间,大小写字母或者数字均可)

text = "abCDf1245"
ret = re.match("^[A-Za-z0-9]{6,20}$",text)
print(ret.group())
  • 1
  • 2
  • 3



更多精彩内容,请关注本人公众号 “bigdeveloper”——程序员大咖秀

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值