正则表达式概述

最新推荐文章于 2023-02-21 21:06:19 发布

Daniel52121

最新推荐文章于 2023-02-21 21:06:19 发布

阅读量302

点赞数 2

正则表达式概述
正则表达式，⼜称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或 RE），是计算机科学的⼀个概念。正则表达式使⽤单个字符串来描述、匹配⼀系列匹配某个句法规则的字符串。在很多⽂本编辑器⾥，正则表达式通常被⽤来检索、替换那些匹配某个模式的⽂本。
Regular Expression的“Regular”⼀般被译为“正则”、“正规”、“常规”。此处的“Regular”即是“规则”、“规律”的意思，Regular Expression即“描述某种规则的表达式”之意。

re模块操作
在Python中需要通过正则表达式对字符串进⾏匹配的时候，可以使⽤⼀个模块，名字为re

re模块的使⽤过程

	#coding=utf-8
	#	导⼊re模块				
	import	re
	#	使⽤match⽅法进⾏匹配操作				
	result	=	re.match(正则表达式,要匹配的字符串)
	#	如果上⼀步匹配到数据的话，可以使⽤group⽅法来提取数据				
	result.group()

1
2
3
4
5
6
7
re.match是⽤来进⾏正则匹配检查的⽅法，若字符串匹配正则表达式，则match⽅法返回匹配对象（Match Object），否则返回None（注意不是空字符串""）。
匹配对象Macth Object具有group⽅法，⽤来返回字符串的匹配部分。
2. re模块示例(匹配以itcast开头的语句)
#coding=utf-8
import re
result = re.match(“itcast”,“itcast.cn”)
re模块操作
result.group()
运⾏结果为：
itcast
3. 说明
re.match() 能够匹配出以xxx开头的字符串

表示字符
字符功能
. 匹配任意1个字符（除了\n）
[ ] 匹配[ ]中列举的字符
\d 匹配数字，即0-9
\D 匹配⾮数字，即不是数字
\s 匹配空⽩，即空格，tab键
\S 匹配⾮空⽩
\w 匹配单词字符，即a-z、A-Z、0-9、_
\W 匹配⾮单词字符

表示数量
匹配多个字符的相关格式
字符功能

         匹配前⼀个字符出现0次或者⽆限次，即可有可⽆

        匹配前⼀个字符出现1次或者⽆限次，即⾄少有1次

? 匹配前⼀个字符出现1次或者0次，即要么有1次，要么没有
{m} 匹配前⼀个字符出现m次
{m,} 匹配前⼀个字符⾄少出现m次
{m,n} 匹配前⼀个字符出现从m到n次

表示边界
字符功能
^ 匹配字符串开头
$ 匹配字符串结尾
\b 匹配⼀个单词的边界
\B 匹配⾮单词边界

匹配分组
字符功能
| 匹配左右任意⼀个表达式
(ab) 将括号中字符作为⼀个分组
\num 引⽤分组num匹配到的字符串
(?P) 分组起别名
(?P=name) 引⽤别名为name分组匹配到的字符串

python贪婪和⾮贪婪
Python⾥数量词默认是贪婪的（在少数语⾔⾥也可能是默认⾮贪婪），总是尝试匹配尽可能多的字符；
⾮贪婪则相反，总是尝试匹配尽可能少的字符。
在"*","?","+","{m,n}"后⾯加上？，使贪婪变成⾮贪婪。

正则表达式模式中使⽤到通配字，那它在从左到右的顺序求值时，会尽量“抓取”满⾜匹配最⻓字符串，在我们上⾯的例⼦⾥⾯，“.+”会从字符串的启始处抓取满⾜模式的最⻓字符，其中包括我们想得到的第⼀个整型字段的中的⼤部分，“\d+”只需⼀位字符就可以匹配，所以它匹配了数字“4”，⽽“.+”则匹配了从字符串起始到这个第⼀位数字4之前的所有字符。
解决⽅式：⾮贪婪操作符“？”，这个操作符可以⽤在"*","+","?"的后⾯，要求正则匹配的越少越好。

作者：倾颜墨染
来源：CSDN
原文：https://blog.csdn.net/weixin_44465743/article/details/88910564
版权声明：本文为博主原创文章，转载请附上博文链接！
正则表达式概述
正则表达式，⼜称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法（英语：Regular Expression，在代码中常简写为regex、regexp或 RE），是计算机科学的⼀个概念。正则表达式使⽤单个字符串来描述、匹配⼀系列匹配某个句法规则的字符串。在很多⽂本编辑器⾥，正则表达式通常被⽤来检索、替换那些匹配某个模式的⽂本。
Regular Expression的“Regular”⼀般被译为“正则”、“正规”、“常规”。此处的“Regular”即是“规则”、“规律”的意思，Regular Expression即“描述某种规则的表达式”之意。