python正则表达式

最新推荐文章于 2022-11-05 17:09:34 发布

>双休日<

最新推荐文章于 2022-11-05 17:09:34 发布

阅读量316

点赞数

文章标签： python

本文链接：https://blog.csdn.net/Abner0101/article/details/124423763

版权

基本概念

正则表达式（Regular Expression），常简写为 regex 或者 RE，又称为规则表达式。它不是某个编程语言所特有的，而是计算机科学的一个概念，通常被用来检索和替换符合某些规则的文本

在python中需要导入re模块使用

# 导入re模块
import re 
# 使用match方法进行匹配操作
result = re.match(正则表达式,要匹配的字符串) 
# 如果上一步匹配到数据的话，可以使用group方法来提取数据
result.group()

re.match() 根据正则表达式从头开始匹配字符串数据，只能从字符串头部开始匹配
除了match等还有多种函数用来操作字符串

一些符号使用，匹配单个字符

. 匹配任意1个字符（除了\n）

 import re
ret = re.match(".","M")
print(ret.group())
ret = re.match("t.o","too")
print(ret.group())
ret = re.match("t.o","two")
print(ret.group())#匹配到t o 之间的一个字符

[]（方括号）匹配[ ]中列举的字符

# 大小写h都可以的情况
ret = re.match("[hH]ello Python","Hello Python")
print(ret.group())

# 匹配0到9第二种写法
ret = re.match("[0-9]Hello Python","7Hello Python")
print(ret.group())
#这种只能匹配0-9数字

\d 匹配数字，即0-9 \D匹配非数字，即不是数字

import re
 # 使用\d进行匹配
ret = re.match("嫦娥\d号","嫦娥1号发射成功") 
print(ret.group())
ret = re.match("嫦娥\d号","嫦娥2号发射成功") 
print(ret.group())
ret = re.match("嫦娥\d号","嫦娥3号发射成功") 
print(ret.group())

\s 匹配空白，即空格和tab键 \S 匹配非空白

import re

# 空格属于空白字符
match_obj = re.match("hello\sworld", "hello world")
if match_obj:
    result = match_obj.group()
    print(result)
else:
    print("匹配失败")

# \t 属于空白字符
match_obj = re.match("hello\sworld", "hello\tworld")
if match_obj:
    result = match_obj.group()
    print(result)
else:
    print("匹配失败")
    import re

match_obj = re.match("hello\Sworld", "hello&world")
if match_obj:
    result = match_obj.group()
    print(result)
else:
    print("匹配失败")


match_obj = re.match("hello\Sworld", "hello$world")
if match_obj:
    result = match_obj.group()
    print(result)
else:
    print("匹配失败")

匹配多个字符

* 匹配前一个字符出现0次或者无限次，即可有可无

匹配前的的意思指匹配字符放在符号前面

import re
 
ret = re.match("[A-Z][a-z]*","M")
print(ret.group())
 
ret = re.match("[A-Z][a-z]*","MnnM")
print(ret.group())
 
ret = re.match("[A-Z][a-z]*","Aabcdef")
print(ret.group())