python——正则的使用re

该篇主要介绍re的使用。

1、re.compile函数

re模块中的重要函数。该函数根据包含的正则表达式的字符串创建模式对象。可以实现更有效率的匹配。在直接使用字符串表示的正则表达式进行search,match和findall操作时,python会将字符串转换为正则表达式对象。而使用compile完成一次转换后,在每次使用模式的时候就不用重复转换。当然,使用re.compile()函数进行转换后,re.search(pattern, string)的调用方式就转换为pattern.search(string)的调用方式。

import re

some_text = 'a,b,,,,c d'
reObj = re.compile('[, ]+')
reObj.split(some_text)
# ['a', 'b', 'c', 'd']

2、re.findall函数

定义如下。发返回string中所有与pattern匹配的全部字符串,返回形式为数组。

def findall(pattern, string, flags=0):
    """Return a list of all non-overlapping matches in the string.

    If one or more capturing groups are present in the pattern, return
    a list of groups; this will be a list of tuples if the pattern
    has more than one group.

    Empty matches are included in the result."""

    return _compile(pattern, flags).findall(string)

findall的两种表示形式

import re

kk = re.compile(r'\d+')
print(kk.findall('one1two2three3four4'))
# [1,2,3,4]

# 注意此处findall的用法,可传两个参数:
kk = re.compile(r'\d+')
print(re.findall(kk,"one123"))
# [1,2,3]

(1)re,findall中的正则表达式(.*?)

字符串

import re

str = 'aabbabaabbaa'
print(re.findall(r'a.b', str))  # . 匹配除\n以外的任意一个字符
# ['aab', 'aab']

print(re.findall(r'a*b', str)) # * 前面的字符出现0次或以上
# ['aab', 'b', 'ab', 'aab', 'b']

print(re.findall(r'a.*b', str)) # .* 贪婪,匹配从.*前面为开始到后面为结束的所有内容
# ['aabbabaabb']

print(re.findall(r'a.*?b',str)) # 非贪婪,遇到开始和结束就进行截取,因此截取多次符合的结果,中间没有字符也会被截取
# ['aab', 'ab', 'aab']

print(re.findall(r'a(.*?)b', str))  # 符号(.*?)非贪婪,与上面一样,只是与上面的相比多了一个括号,只保留括号的内容
# ['a', '','a']

(2)re,findall中的参数re.S

import re

str = '''aabbab
		 aabbaa
		 bb'''
print(re.findall(r'a.*?b', str))  # 参数无re.S,没有把最后一个换行的aab算进来
# ['aab', 'ab', 'aab']

print(re.findall(r'a.*?b', str, re.S))
# ['aab', 'ab', 'aab', 'aa\n\t\t b']  # 参数有re.S,不会对\n进行中断

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值