Python————正则表达式



前言

  • 在实际开发过程中经常会有查找符合某些规则的字符串
    • 比如:邮箱、图片地址、手机号码等。想匹配或者查找符合某些规则的字符串就可以使用正则表达式了。

一、正则表达式是什么?

  • 正则表达式(regular expression)描述了一种字符串匹配的模式,
    1、比如:检索一个串是否含有某种子串(检索)
    2、比如:匹配的子串做替换(替换)
    3、比如:从一个串中取出符合某个条件的子串(提取)

  • 模式:一种特定的字符串模式,这个模式是通过一些特殊的符号组成的。

正则表达式并不是Python所特有的,在Java、PHP、Go以及JavaScript等语言中都是支持正则表达式的。

二、使用模块 re

# 第一步:导入re模块
import re
# 第二步:使用match方法进行匹配操作
result = re.match(pattern正则表达式, string要匹配的字符串, flags=0) 
#flags : 可选,表示匹配模式,比如忽略大小写,多行模式等
# 第三步:如果数据匹配成功,使用group方法来提取数据
result.group()

三、re 模块中的代码图示

3.1 re模块匹配单个字符

代码功能
.匹配任意1个字符(除了\n)
[ ]匹配 [ ] 中列举的字符
[^指定字符]匹配除了指定字符以外的所有字符
\d匹配数字,即0-9
\D匹配非数字,即不是数字
\s匹配空白,即 空格,tab键
\S匹配非空白
\w匹配非特殊字符,即a-z、A-Z、0-9、_、汉字
\W匹配特殊字符,即非字母、非数字、非汉字

3.2 re模块匹配多个字符

代码功能
*匹配前一个字符出现0次或者无限次,即可有可无
+匹配前一个字符出现1次或者无限次,即至少有1次
?匹配前一个字符出现1次或者0次,即要么有1次,要么没有
{n}恰好n次, 多一次少一次都不行.
{n, }至少n次, 至多无所谓
{n,m}至少 n 次, 至多 m 次, 包括 n 和 m

3.3 re模块匹配开头跟结尾

代码功能
^匹配字符串开头
$匹配字符串结尾

3.4 re模块匹配分组

代码功能
|匹配左右任意一个表达式
(ab)将括号中字符作为一个分组
\num引用分组num匹配到的字符串

3.5 扩展:

  • (?P <分组名>) 给分组起名字
  • (?P = 分组名) 使用指定分组的内容

总结

  • 正则表达式的代码跟功能图示。
  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值