第四周——爬虫入门 Day4 7.21

最新推荐文章于 2024-10-08 09:21:46 发布

FancySYZ

最新推荐文章于 2024-10-08 09:21:46 发布

阅读量111

点赞数

文章标签：爬虫 python 学习正则表达式

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/FancySYZ/article/details/125916362

版权

学习时间：9:00——11:00 15:00——16:30

今天学习的是正则表达式

.表示匹配除了换行符以外的任何单个字符
*表示匹配前面的子表达式任意次，包括0次（.*表示匹配任意字符的任意次数）
+表示匹配前面的子表达式一次或多次，不包括0次
花括号{}表示匹配前面字符的指定次数（花括号内可写出现次数的范围{x,y}也可以指定固定次数{x}）
贪婪模式：尽可能多的匹配内容，例如：'*','+','?'
非贪婪模式：尽可能少的匹配内容，也就是在表示贪婪模式的元字符后面加上?,例如：'*?','+?','??'
对元字符的转义：使用反斜杠\进行转义
匹配某种字符类型：\后面接一些字符（大写表示非）

\d：匹配0-9之间任意一个数字字符
\D：匹配任意一个不是0-9之间的字符
\s：匹配任意一个空白字符
\w：匹配任意一个文本字符，包括大小写字母、数字、下划线，既包括Unicode文字字符，也包括ASCII码的字母

方括号[]：表示匹配括号内范围的字符，例如[abc]可以匹配a或b或c的任意一个字符，相当于[a-c]，一些元字符在方括号中表示普通字符，如果方括号中使用^，表示非方括号里的字符集合
^表示匹配文本的起始位置，正则表达式可以设定单行模式和多行模式，如果是单行模式，表示匹配整个文本的开头位置；如果是多行模式，表示匹配文本每行的开头位置
$表示匹配文本的结束位置，用法同^
圆括号()称为正则表达式的组选择，是从正则表达式匹配的内容中扣选出来的某些部分

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。