python学习笔记--正则表达式

正则表达式描述了一种字符串匹配模式
先贴出常用正则表达式元字符:

在这里插入图片描述
代码示例:`

import re
s = 'total income is around $750,000, ended with 3000'

反斜杠\

print(re.findall('\$',s))
>>>['$']

\d即[0-9]

print(re.findall('\d',s))
>>>['7', '5', '0', '0', '0', '0', '3', '0', '0', '0']

+ 等价于 {1,正无穷}

print(re.findall('i+',s))
>>>['i', 'i', 'i']
print(re.findall('0+',s))
>>>['0', '000', '000']

* 等价于 {0,正无穷}

print(re.findall('i*',s))
>>>['', '', '', '', '', '', 'i', '', '', '', '', '', '', 'i', '', '', '', '', '', '', '', '', '', 
'', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', 'i', '', '', '', '', '', '', '', '']
print(re.findall('0*',s))
>>>['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '0',
> '', '000', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '000', '']

等价于 {0,1}

print(re.findall('0?',s))
>>>['', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '0',
>'', '0', '0', '0', '', '', '', '', '', '', '', '', '', '', '', '', '', '', '0', '0', '0','']

. 通常用来获取外链

print(re.findall('.',s))
>>>['t', 'o', 't', 'a', 'l', ' ', 'i', 'n', 'c', 'o', 'm', 'e', ' ', 'i', 's', ' ', 'a', 'r', 'o', 'u', 'n', 'd', 
' ', '$', '7', '5', '0', ',', '0', '0', '0', ',', ' ', 'e', 'n', 'd', 'e', 'd', ' ', 'w', 'i', 't', 'h', ' ', 
'3', '0', '0', '0']

s1 = '<a href="https://www.baidu.com">Baidu</a>'
print(re.findall('href=\".*\"',s1))
>>>['href="https://www.baidu.com"']

() 一种筛选规则,匹配时按照整体正则匹配,输出时只保留括号内的内容

print(re.findall('href=\"(.*)\"',s1))
>>>['https://www.baidu.com']

贪婪模式
贪婪与非贪婪模式影响的是被量词修饰的子表达式的匹配行为,贪婪模式在整个表达式匹配成功的前提下,尽可能多的匹配,而非贪婪模式在整个表达式匹配成功的前提下,尽可能少的匹配
例:

import re
s = 'chinahadoop'
s1 = '<a href="https://www.baidu.com">Baidu</a>'

贪婪模式:

print(re.findall('.*(h.*a).*',s)[0])
>>>ha

非贪婪模式:

print(re.findall('.*?(h.*?a).*',s)[0])
>>>hina

前面不加?会尽可能的匹配即会一直匹配到第二个h
后面不加?会匹配到最后一个a
另外,python的正则表达式没有完全按照正则表达式规范实现,所以一些高级特性建议使用其他语言如java、scala等

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值