基础爬虫-----正则表达式(元字符和模式修正符介绍)

1.元字符类型

# 元字符
'''
. 除换行外任意一个字符
^ 匹配开始位置
$ 结束位置
* 0\1\多次
?0\1次
+ 1\多次
{n} 恰好出现n次
{n,} 至少n次
{n,m} 至少n次,至多m次
| 模式选择符或
() 模式单元
'''

1.2.案例代码:(运行结果已标注,具体结果自己复制代码测试)

string = "taoyunnnnj i51468525aoyubaidu"
# 输出taoyun
data = "tao..."
# 输出taoyun 如果是"^ao.."报错报错---因为字符串不是a开始的
data = "^tao.."
# 输出baidu
data = "ba..$"
# 全部输出从a开始
data = "ao.*"
# 全部输出从t开始
data = "tao.+"
# 多个n全部输出
data = "taoyun+"
# n输出3个,想要输出几个大括号写多少就OK!
# 如果n>已有n的数量----报错报错
data = "taoyun{3}"
# 至少输出3个,加逗号即可
data = "taoyun{3,}"
ret =re.search(data,string)
print(ret)

2.模式修正符的类型:

# 模式修正符 *代表长用的
'''
I 忽略大小写*
M 多行匹配*
L 本地化识别匹配(少用)
U Unicode编码
S 让.(点)匹配包括换行*

'''

2.1案例代码:(运行结果已标注,具体结果自己复制代码测试)

string = "python"
# 正常输出pyt,如果data = "Pyt"运行结果则为None
data = "Pyt"
# 为了解决大小写问题,我们要在函数里面加如下
result = re.search(data,string,re.I)
print(result)

 

  • 0
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值