Python正则表达式一

最新推荐文章于 2023-02-15 10:10:44 发布

菜鸟之神

最新推荐文章于 2023-02-15 10:10:44 发布

阅读量285

点赞数 1

分类专栏： Python 文章标签： python

本文链接：https://blog.csdn.net/csdntt00/article/details/78536617

版权

Python 专栏收录该内容

45 篇文章 0 订阅

订阅专栏

1）正则表达式

# 正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配

注：以上图片引用自网络

  2）req正则对象和正则匹配效率比较 

# re模块是python中处理正则表达式的一个模块，通过re模块的方法，把正则表达式pattern编译成正则对象，
# 以便使用正则对象的方法，这样可以提高代码的执行效率
import timeit
print timeit.timeit(setup='''import re; reg = re.compile('<(?P<tagname>\w*)>.*</(?P=tagname)>')''', stmt='''reg.match('<h1>xxx</h1>')''', number=1000000)
print timeit.timeit(setup='''import re''', stmt='''re.match('<(?P<tagname>\w*)>.*</(?P=tagname)>', '<h1>xxx</h1>')''', number=1000000)
# timeit.timeit是用来统计程序执行的时间的，和明显第一个print的执行时间要比第二个的执行时间快好多，
# 这个就是把正则表达是表示成正则对象最明显的好处
# 正则匹配是，优先编译成正则对象，然后再进行匹配，这样程序的效率更高

运行结果：
0.968780225101
2.30360883934

  3）编译正则对象 

# 正则匹配总写一个r，r表示raw的简及raw string 意思是原生字符，也就是说是这个字符串中间的特殊字符不用转义
# 比如要表示‘\n’,可以这样：r'\n'，如果不用原生字符 而是用字符串就得这样：‘\\n’
# re.compile(pattern[, flags])
# 这个方法是就是将字符串的正则表达式编译成正则对象，第二个参数flag是匹配模式，
# 取值可以使用按位或者运算符“|”表示同时生效，比如：re.I | re.M，flag的可选值有：

# re.I(re.IGNORECASE): 忽略大小写（括号内是完整写法，下同）
# M(MULTILINE): 多行模式，改变'^'和'$'的行为
# S(DOTALL): 点任意匹配模式，改变'.'的行为
# L(LOCALE): 使预定字符类 \w \W \b \B \s \S 取决于当前区域设定
# U(UNICODE): 使预定字符类 \w \W \b \B \s \S \d \D 取决于unicode定义的字符属性
# X(VERBOSE): 详细模式。这个模式下正则表达式可以是多行，忽略空白字符，并可以加入注释

# 以下两个正则表达式是等价的：
# a = re.compile(r"""\d +  # the integral part
#                    \.    # the decimal point
#                    \d *  # some fractional digits""", re.X)
# b = re.compile(r"\d+\.\d*")
import re
reg = re.compile(r'abc.*')
print(reg)
print(type(reg))

运行结果：
<_sre.SRE_Pattern object at 0x00000000016A4F30>
<type '_sre.SRE_Pattern'>

菜鸟之神

关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
Python正则表达式一

1）正则表达式# 正则表达式是一个特殊的字符序列，它能帮助你方便的检查一个字符串是否与某种模式匹配注：以上图片引用自网络2）req正则对象和正则匹配效率比较# re模块是python中处理正则表达式的一个模块，通过re模块的方法，把正则表达式pattern编译成正则对象，# 以便使用正则对象的方法，这样可以提高代码的执行效率import ti
复制链接

扫一扫

专栏目录