正则表达式笔记

最新推荐文章于 2024-02-21 10:35:33 发布

菀青

最新推荐文章于 2024-02-21 10:35:33 发布

阅读量123

点赞数

分类专栏：数据基础文章标签：正则表达式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_32733847/article/details/94016652

版权

数据基础专栏收录该内容

13 篇文章 1 订阅

订阅专栏

对字符串操作的逻辑公式。

	语法规则
.	匹配除\n之外的字符
\	转义符，使用r
[…]	字符集，任意字符，可逐个列出，可范围
[^…]	取反

	预定义字符集，可写在[…]中
\d	[0-9]
\D	[^\d]
\s	空白字符，\t \r \n \f \v
\S	非空白字符[^\s]
\w	单词字符[A-Z a-z 0-9]
\W	非单词字符[^\w]

	数量词
*	大于等于零次
+	大于等于一次
？	0或1
{m,n}	m到n次
*？	非贪婪模式

	边界匹配
^	匹配字符串开头
$	匹配字符串结尾
\A	仅匹配开头
\Z	仅匹配结尾
\b	匹配\w和\W之间
\B	[^\b]

	逻辑，分组
\|	左右分别匹配，或
(…)	分组，编号+1
(?P<name>…)	分组指定别名
\<name>	引用编号为number的分组匹配
(?P=name)	引用别名<name>

	特殊构造
(?:…)	不分组版
(?#…)	注释
(?=…)	之后匹配
(?!..)	之后不匹配
(?<=…)	之前匹配
(?<!..)	之前不匹配
(?(id/name) yes\|no)	如果id name匹配到，匹配yes

#贪婪模式：匹配到尽可能多的字符。abbbc→ab→abbb
非贪婪模式：abbbc→ab？→a
#反斜杠：\\ = r’’

使用pattern匹配，通过compile编译成pattern对象，匹配。

re.compile(string [,flag])

flag：
re.I:忽略大小写
re.M:多行模式
re.S:点任意匹配，会匹配到换行符
re.L:使用预定字符类
re.U:使用Unicode
re.X:多行，忽略空白，加入注释

re.match(pattern)

从头开始，匹配完成时停止。

pattern = re.compile(r'hello')
result = re.match(pattern, 'hello world!')
if result:
	print(result.group())
else:
	print('fail')

re.start()
re.end()
re.span([group])	#返回（start(),end()）
re.expand(r'\2 \1\3')	#world hello!

#取出含‘o’的单词
string='together,we did not do it'
print(re.findall('\w*o\w*',string,re.I))

#将符号，字母删除
string='你在干a啥?'
print(re.sub('[,.、a-zA-Z0-9())','',string)

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。