正则表达式笔记


新手的学习笔记,便于自己熟悉和记忆。

1、常用的匹配规则

模式描述
\w匹配字母、数字及下下划线
\W匹配不是字母、数字及下下划线的字符
\s匹配任意空白字符
\S匹配任意非空字符
\d匹配数字,等价于[0-9]
\D匹配不是数字的字符
\A匹配字符串开头
\Z匹配字符串结尾的,如果存在换行,只匹配到换行前的结束字符串
\z匹配字符串结尾的,如果存在换行,同时匹配到换行符\n
\G最后完成匹配的位置
\n匹配一个换行符
\t匹配一个制表符(tab)
^匹配一行字符串的开头
$匹配一行字符串的结尾
.匹配任意字符,除了换行符.当re.DOTALL标记被指定时,这可以匹配包括换行符在内的任字符
[…]用来表示一组字符,比如[abc]表示匹配a或b或c,[a-z],[0-9]
[^…]匹配不在[]里面的字符,比如[^abc]匹配除a,b,c以外的字符
*匹配0个或多个字符 (.*)表示贪婪
+匹配1个或多个字符
?匹配0个或1个前面的正则表达式片段,(.*?)表示非贪婪,
{n}精确匹配前面n个前面的表达式,如\d{5}表示匹配5个数字
{n,m}匹配前面的表达式n到m次,贪婪模式
ab
(…)匹配括号里的表达式,也可以表示一个组
()匹配括号内的表达式,也表示一个组

2、 常用的方法

1、match(pattern, string, flags=0)

     pattern:正则表达式内容。
     string:被匹配的字符串。
     flags:修饰符。
        该方法会尝试从字符串的起始位置匹配表达式,如果匹配成功,就返回结果,反之返回None。
import re
# 定义一个字符串。
string = 'Hello 1234567 World This is a Regex Demo'

# 定义一个正则表达式的字符串
pattern = '^Hello.*?Demo$'

# 使用match(pattern, string, flags=0)方法
result = re.match(pattern, string)
print('文本长度:'+str(len(string)))
# 用.span()方法显示匹配结果的长度
print(result.span())
# 用.group()方法输出匹配的结果
print(result.group())


'''
输出结果如下:
文本长度:40
(0, 40)
Hello 1234567 World This is a Regex Demo
'''



转义匹配

如果在匹配文本中出现().*等符号时,在构建正则表达式时,应使用反斜线\进行转义。
例如

import re

string = '(百度)www.baidu.com'

pattern = '\(百度\)www\.baidu\.com'

result = re.match(pattern, string)
# 用.span()方法显示匹配结果的长度
print(result.span())
# 用.group()方法输出匹配的结果
print(result.group())


'''
输出结果如下:
(0, 17)
(百度)www.baidu.com
'''

修饰符

修饰符描述
re.I(常用)使匹配对大小写不敏感
re.L做本地化识别(locale-aware)
re.M多行匹配,影响^和$
re.S(常用)使.匹配包括换行在内的所有字符
re.U根据Unicode字符集解析字符。这个标志影响\w,\W,\b和\B
re.X该标志通过给与你更灵活的格式以便你将正则表达式写得更易于理解

2、search(pattern, string, flags=0):

match()方法是从字符串的开头开始匹配,一旦开头不匹配,那么整个匹配就会失败。这时候就需要用到search()方法。
实例入下:
import re
# 定义一个字符串。
string = 'Hello 1234567 World This is a Regex Demo'


result = re.match('ello.*?Demo$', string)


# 此时result匹配失败,结果为None.
print(result)

print("="*50)
# 使用search()方法匹配成功
result_search = re.search('ello.*?Demo$', string)
print(result_search)

'''
输出结果
None
==================================================
<_sre.SRE_Match object; span=(1, 40), match='ello 1234567 World This is a Regex Demo'>

'''

3、findall(pattern, string, flags=0):

前面的match(),search()方法都只能匹配一个结果,如果需要从字符串中匹配多个符合条件的结果,就需要用到findall()方法,
findall()方法会返回一个包含多个元祖的列表。

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python正则表达式的判断可以使用re模块。该模块提供了一系列函数来操作正则表达式。常用的函数有match()、search()和findall()等。match()函数用于判断一个字符串是否与正则表达式匹配,search()函数用于在字符串中搜索匹配正则表达式的内容,findall()函数用于在字符串中查找所有匹配正则表达式的内容。 另外,正则表达式中还有一些特殊字符和转义字符,比如^、$、*、+、?、.等,它们在正则表达式中有特殊的含义。例如^表示字符串的开始,$表示字符串的结束,*表示匹配0个或多个前面的字符。要注意,正则表达式中的特殊字符需要使用转义字符\来进行转义,例如\*表示匹配字面上的*。 总结来说,Python正则表达式的判断可以使用re模块的函数,同时需要注意正则表达式中的特殊字符和转义字符的使用。编写正则表达式时,需要仔细理解正则表达式的语法规则,并注意不同规则之间的细微差别。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* *3* [Python 正则式学习笔记](https://blog.csdn.net/whycadi/article/details/2011046)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_2"}}] [.reference_item style="max-width: 100%"] [ .reference_list ]

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值