RPA教学：正则表达式使用系列（六）贪婪模式与非贪婪模式

艺赛旗RPA

于 2020-11-24 11:44:49 发布

阅读量213

点赞数

分类专栏： RPA RPA教程 python基础文章标签： python RPA

本文链接：https://blog.csdn.net/weixin_44447687/article/details/110061566

版权

python基础同时被 3 个专栏收录

343 篇文章 3 订阅

订阅专栏

RPA教程

324 篇文章 27 订阅

订阅专栏

RPA

131 篇文章 9 订阅

订阅专栏

关注RPA请访问网站：
www.i-search.com.cn
学Python,用RPA,欢迎下载使用
https://www.i-search.com.cn/?from=csdn

贪婪模式与非贪婪模式
贪婪模式：在整个表达式匹配成功的前提下，尽可能多的匹配 (*)；
非贪婪模式：在整个表达式匹配成功的前提下，尽可能少的匹配 (?)；
Python 里数量词默认是贪婪的。
示例一

import re
str = ‘abbbc’
# 贪婪模式
pattern = re.compile(r’ab*’) # * 决定了尽可能多匹配 b,结果是 abbb
result = pattern.match(str)
print(result.group())
# 非贪婪模式
pattern = re.compile(r’ab*?’) # *? 决定了尽可能少匹配 b，结果是 a
result = pattern.match(str)
print(result.group())
pattern = re.compile(r’ab+?’) # *? 决定了尽可能少匹配 b，结果是 ab
result = pattern.match(str)
print(result.group())
在这里插入图片描述

示例二

import re
# 贪婪模式
str = “aa

test1

test2

cc”
pattern = re.compile(r’

’) # 决定了尽可能多匹配 b, 结果是

test1

test2

result = pattern.search(str) print(result.group()) # 非贪婪模式 str = "aa

test1

test2

cc" pattern = re.compile(r'

.*?

') # *? 决定了尽可能少匹配 b，结果是

test1

result = pattern.search(str) print(result.group()) ![在这里插入图片描述](https://img-blog.csdnimg.cn/20201124114418780.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3dlaXhpbl80NDQ0NzY4Nw==,size_16,color_FFFFFF,t_70#pic_center)

正则表达式测试网址
http://tool.oschina.net/regex/

匹配中文
中文的 unicode 编码范围主要在 [u4e00-u9fa5] （全角（中文）标点等除外），丌过，
在大部分情况下，应该是够用的。
假设现在想把字符串 title = u’你好，hello，世界’ 中的中文提取出来，可以这么做：

import re
title = ‘你好，hello，世界’
pattern = re.compile(r’[\u4e00-\u9fa5]+’)
result = pattern.findall(title)
print(result)

艺赛旗RPA

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
RPA教学：正则表达式使用系列（六）贪婪模式与非贪婪模式

关注RPA请访问网站：www.i-search.com.cn学Python,用RPA,欢迎下载使用https://www.i-search.com.cn/?from=csdn贪婪模式与非贪婪模式贪婪模式：在整个表达式匹配成功的前提下，尽可能多的匹配 (*)；非贪婪模式：在整个表达式匹配成功的前提下，尽可能少的匹配 (?)；Python 里数量词默认是贪婪的。示例一import restr = ‘abbbc’# 贪婪模式pattern = re.compile(r’ab*’) # *
复制链接

扫一扫

专栏目录