正则表达式

最新推荐文章于 2021-12-31 23:43:28 发布

~果冻~

最新推荐文章于 2021-12-31 23:43:28 发布

阅读量307

点赞数

分类专栏：基础总结文章标签：字符串 python

本文链接：https://blog.csdn.net/qq_60148446/article/details/119336296

版权

基础总结专栏收录该内容

17 篇文章 0 订阅

订阅专栏

正则表达式

re模块

python提供专门用来支持正则表达式的一个模块

正则语法 - 是让字符串复杂问题变得简单的工具

"""
python正则表达式：r'正则表达式'

匹配字符 
. 	  -	   匹配任意一个字符
\d    -    匹配一个数字  
\s    -    匹配任意一个空白字符  空格、回车\n、制表符\t
\D	  -    匹配任意一个非数字
\S    -    匹配任意一个非空白字符
\w    -    匹配任意一个字母、数字或下划线
[字符集]  - 匹配字符集中的任意一个字符 [a-z] [\babc]
[^字符集]  -  匹配不在字符集中的任意一个字符
"""

检测类符号

"""
检测类符号的存在不影响被匹配的字符串长度，它的作用是在匹配成功的前提下检测符号所有在的位置符合要求
检测类符号的用法: 先去掉检测类符号，看是否能匹配成功，如果失败整个正则匹配失败，如果成功再看检测符号所在的位置是否符合要求

\b -  检测是否是单词边界
单词边界  - 能够区分两个不同单词的符号都是单词边界，例如: 空白 标点符号 字符串开头字符串结尾
\B  -  检测是否是非单词边界

^   - 检测是否是字符串开头

$  -  检测是否是字符串结尾

“”"

匹配次数

"""
*  -  匹配0次或者多次(任意次数)
+  -  匹配1次或者多次(至少一次)
?  -  匹配0次或1次
{N} - 匹配N次
{M,N} 匹配M到N次
{,N}   -  匹配最多N次
{M,}   -  匹配至少M次

# 注意 匹配次数对应的符号前面必须是匹配类符号

"""

分组和分支

"""
()  -  分组
作用1：将()中的内容作为一个整体，进行整体相关操作，例如:整体控制次数
作用2：通过'\M' 重复前面第M个分组匹配到的结果，M从1开始
作用3：捕获(findall)

|  - 分支
正则1|正则2  -  先用正则1进行匹配如果直接，如果成功就直接匹配成功，如果失败再用正则2进行匹配

3. 转义符号
在特殊符号前加\，让符号的功能消失，变成一个普通符号
独立存在有特殊功能的符号，将符号放入[]中其功能也会自动消失

"""

re模块

"""
fuiimatch()
macth()
search()
findall()
finiter()
split()
sub()

flags参数
# 上面的每一个函数都有一个参数flags，用来设置正则参数
# 1) 单行匹配和多行匹配参数：re.S/ re.M(默认的)
# 单行匹配：.可以匹配\n
# 多行匹配：.不能和\n匹配

# flags=re.S == r'(?s)正则表达式'
# flags=re.S|re.I == r'(?is)正则表达式'

# 2) 忽略大小写:re.I

"""

利用正则表达式完成下面的操作:

一、不定项选择题

能够完全匹配字符串"(010)-62661617"和字符串"01062661617"的正则表达式包括（A ）

A.r"\(?\d{3}\)?-?\d{8}"
B. r"[0-9()-]+"
C.r"[0-9(-)]*\d*"
D.r"[(]?\d*[)-]*\d*"

能够完全匹配字符串“back”和“back-end”的正则表达式包括（ B）
A. r“\w{4}-\w{3}|\w{4}”
B. r“\w{4}|\w{4}-\w{3}”
C.r “\S±\S+|\S+”
D. r“\w*\b-\b\w*|\w*”
能够完全匹配字符串“go go”和“kitty kitty”，但不能完全匹配“go kitty”的正则表达式包括（A）
A.r “\b(\w+)\b\s+\1\b”
B. r“\w{2,5}\s*\1”
C. r“(\S+) \s+\1”
D. r“(\S{2,5})\s{1,}\1”
能够在字符串中匹配“aab”，而不能匹配“aaab”和“aaaab”的正则表达式包括（B ）
A. r“a*?b”
B. r“a{,2}b”
C. r“aa??b”
D. r“aaa??b”

二、编程题

1.用户名匹配

要求: 1.用户名只能包含数字字母下划线

2.不能以数字开头

3.⻓度在 6 到 16 位范围内

r'[a-zA-Z_]\w{5,15}'

密码匹配

要求: 1.不能包含!@#¥%^&*这些特殊符号

2.必须以字母开头

3.⻓度在 6 到 12 位范围内

result = re.fullmatch(r'[a-zA-Z][^!@#¥%^&*]{5,11}','a12ddc9')

ipv4 格式的 ip 地址匹配
提示: IP地址的范围是 0.0.0.0 - 255.255.255.255

r'([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?).([0-2][0-5]?[0-5]?)'

提取用户输入数据中的数值 (数值包括正负数还包括整数和小数在内) 并求和

例如:“-3.14good87nice19bye” =====> -3.14 + 87 + 19 = 102.86

import re

str1 = '-3.14good87nice19bye'
result = re.findall(r'-?[1-9]\d*\.*\d*', str1)
sum1 = 0
for x in result:
    sum1 += eval(x)
print(sum1)

验证输入内容只能是汉字

str1 = input('请输入:')
re_str = re.fullmatch(r'[\u4e00-\u9fa5]*', str1)
if re_str:
    print('内容只有汉字')
else:
    print('内容有汉字以外的字符')

匹配整数或者小数（包括正数和负数）

result = re.fullmatch(r'-?[0-9]\d*.?\d*', '-0.789')
print(result)

验证输入用户名和QQ号是否有效并给出对应的提示信息

要求：
用户名必须由字母、数字或下划线构成且长度在6~20个字符之间
QQ号是5~12的数字且首位不能为0

username = input('请输入用户名:')
name = re.fullmatch(r'\w{6,20}', username)
if name:
	print('用户名正确')
else:
    print('用户名必须由字母、数字或下划线构成且长度在6~20个字符之间')
    
qq = input('请输入QQ:')
QQ = re.fullmatch(r'[1-9]\d{4,11}', qq)
if QQ:
    print('QQ号正确')
else:
    print('QQ号是5~12的数字且首位不能为0')

拆分长字符串：将一首诗的中的每一句话分别取出来
poem = ‘窗前明月光，疑是地上霜。举头望明月，低头思故乡。’
```
result = re.split(r'[,。]',poem)
```

~果冻~

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
正则表达式

正则表达式re模块python提供专门用来支持正则表达式的一个模块正则语法 - 是让字符串复杂问题变得简单的工具"""python正则表达式：r'正则表达式'匹配字符 . - 匹配任意一个字符\d - 匹配一个数字 \s - 匹配任意一个空白字符空格、回车\n、制表符\t\D - 匹配任意一个非数字\S - 匹配任意一个非空白字符\w - 匹配任意一个字母、数字或下划线[字符集] - 匹配
复制链接

扫一扫