1.正则表达式简单学习

最新推荐文章于 2024-06-08 13:16:10 发布

zmjames2000

最新推荐文章于 2024-06-08 13:16:10 发布

阅读量154

点赞数

分类专栏：爬虫 python 文章标签：爬虫 python

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/zmjames2000/article/details/100605142

版权

python 同时被 2 个专栏收录

56 篇文章 0 订阅

订阅专栏

18 篇文章 0 订阅

订阅专栏

\n 换行符 \t 制表符

\w 匹配一个字母，数字，下划线 word

\W 除\w了以外的任意字符

\d 十进制数 digit

\D 除十进制数之外的任务字符

\s 空白字符 [\s]表示，只要出现空白就匹配

\S 除空白字符任意字符 space [\S]表示，非空白就匹配

原子表 [] ：表示从[]任意提出一个元素出来

‘tao[xyz]yun’ 只能任意提出一个 x or y or z

[^xuy] 除了xuy以外的字符都可以， ^表示非的意思。 ^在[]表示开始位置

. 除换行外任意一个字符

^ 不再[]中表示，开始位置，^tao... 表示开始必须是tao

$ 表示结束位置 tao$结束必须 o结尾

* 0,1,多次 tao.* 表示前面的原子(.)，能匹配到多少次，且这里能一直匹配到结尾

? 0，1次懒惰模式，和贪婪模式

+ 1次，多次 tao+ 表示前面的原子（o）出现至少1次，或多次

{n} 前面出现恰好n次 jun{2} 前面的原子n出现2次

{n,} 至少出现n次

{n,m} 至少出现n次，最多出现m次

| 或，模式选择符 [.com|.cn]

() 模式单元

I (i的大写字母re.I)匹配时忽略大小写 num = re.search(pat,stringName,re.I)

M 多行匹配

L 本地化识别匹配

U unicode

S 让. 匹配换行符意思：可以多行匹配

贪婪模式 p.*y *表示：前面的原子出现0，1，多次，前面是.：任意字符除了换行。所以都会匹配

懒惰模式 p.*?y 表示找到就停止 p.*?y 找到poy 之后就不会在找了

Re.match是从头开始匹配

Re.search是任意地方开始匹配

Re.sub() 替换

re.compile(正则表达式）.finall(数据) # 还有一个生成器 filter

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。