Python中正则表达式的使用

原创 2016年01月22日 17:24:50

正则表达式是一种非常强大的工具,是用来对文本(字符串)的匹配,搜索的利器,一门好的语言都不可缺少这一模块,在Python中,re模块就集成了所有正则表达式的功能

关于正则表达式的语法,在这里就不赘述了,本文主要讲一些python中的实例用法:

首先,把re模块中所有的函数和方法在此列举一番:match,search,findall,split.sub,group,groups,compile

1.match(p,s)

一般是两个参数,p:正则表达式(也相当于一个字符串);s:要匹配的字符串

从头开始匹配正则表达式,从p的第一个字符开始匹配,匹配中就输出匹配到的内容,没有就返回None

import re
m = re.match('[a-z]=[0-9]','ssaa=0jinleib=1')   //匹配不到

m = re.match('[a-z]=[0-9]','a=0jinleib=1')   //匹配到'a=0'

2.search(p,s)

跟match的唯一区别就是,它不是从头开始匹配,

import re
m = re.search('[a-z]=[0-9]','ssaa=0jinleib=1')   //匹配到'a=0',但是不会输出b=1,因为它只返回一个匹配到结果

3.group,groups

之所以把这两个函数放在这个位置,是因为你match或者search完之后,想知道自己匹配到的内容是什么,就要用到group,groups。

看上面的例子,m是返回值,它的类型是一个对象,直接输出是看不到结果的,所以就要用到m.group(),或者m.groups()。这样就会输出一个字符串

再说说group和groups的区别:只有正则表达式p中有用'()'括起来的内容,并且匹配成功,用groups才会有结果,要不然都是None,而group都可以用,只不过当正则表达式p中有用'()'括起来的内容时,group会有一个参数,是整数类型,如果是1,就输出p中第1个用'()'括起来的匹配到的内容,以此类推,类似于数组,只不过不是从0开始。

4.findall

参数,和match,search一样,不同的是它返回的是一个列表list,里面含有所有匹配到内容,下面两个例子:

>>>re.findall('car','the car is so carry the barcarid')

['car','car','car']       //匹配到所有的car

import re
m = re.findall('([a-z])=([0-9])','ssaa=0jinleib=1') 

结果:[ ('a','0'), ('b','1') ]      //注意,列表里面的元素已经变成元组了,而元组里面的元素分别是p中两个()括起来的内容,这里就是用()和不用()的区别

5.split

参数还是一样,一个p,一个s。但是要注意一点的是,千万不要和字符串的内建函数(也叫)split混淆!

相信大家对字符串的split函数很熟悉:s='jinlei' s.split('l',s) = [ 'jin', 'ei' ]

这个split的功能是根据正则表达式所能匹配的字符串来分割字符串:

str = '   1.7  2.3 4    123'
alist = re.split(r'\s+',str)
print alist         //猜猜结果是什么?没错[ '','1.7','2.3','4','123' ]。\s表示空格符,以一个或者多个空格为分隔符分割字符串str。

6.sub(p,rep_s,s)

功能:用替代字符串rep_s代替用正则表达式p在目标字符串s上匹配到的内容。

>>>re.sub('X','me','is X')

'is me'       //输出结果

7.compile(p)

一般只是一个参数,它的功能就是编译正则表达式p,它返回一个regex对象

reg = re.compile('d')

reg.match('sd')  //没有匹配到

reg.match('d')   //匹配到d,

返回结果和上面直接用match函数一样,是一个对象,或者None。


好了,有了这些,只要你清楚正则表达式的基本语法,以及在python中一些特殊字符,多加练习,python的正则表达式就能手到擒来啦!!

版权声明:本文虽为博主原创文章,但可随意转载。 https://blog.csdn.net/u011339641/article/details/50562933

Python 之正则表达式 使用介绍

概述正则表达式是一个特殊的字符序列,它能帮助你方便的检查一个字符串是否与某种模式匹配。 Python 自1.5版本起增加了re 模块,它提供 Perl 风格的正则表达式模式。 re 模块使 Pyt...
  • lvchenqiang_
  • lvchenqiang_
  • 2017-08-22 00:43:17
  • 304

Python中的正则表达式

基于Python 2.7 #!/usr/bin/env python # -*- encoding=utf-8 -*-import re s = 'ABC\\-001' #对应 'ABC\-001...
  • OOC_ZC
  • OOC_ZC
  • 2017-04-11 11:36:28
  • 366

总结一下python正则表达式中的变量使用问题

在工作中,有这样的一个场景,需要在一个正则表达式中,匹配一个变量。因此查阅了好多文档,最后找到了。 方法是这样: re.finditer(r'(%s)(\d{1,3})(\s*\s+\d{1,...
  • tongjinrui
  • tongjinrui
  • 2018-01-03 14:25:55
  • 433

Python正则表达式:如何使用正则表达式

正则表达式(简称RE)本质上可以看作一个小的、高度专业化的编程语言,在Python中可以通过re模块使用它。使用正则表达式,你需要为想要匹配的字符串集合指定一套规则,字符串集合可以包含英文句子、e-m...
  • liuy_98_1001
  • liuy_98_1001
  • 2015-06-08 18:22:55
  • 3691

python中正则表达式详解

原文地址:http://www.cnblogs.com/yyyg/p/5498803.html Python 正则表达式模块 (re) 简介 Python 的 re 模块(Regu...
  • wangqing_12345
  • wangqing_12345
  • 2017-05-19 16:04:46
  • 325

正则表达式(Python)

引子 首先说 正则表达式是什么? 正则表达式,又称正规表示式、正规表示法、正规表达式、规则表达式、常规表示法(英语:Regular Expression,在代码中常简写为regex、regexp或R...
  • liuxiangxxl
  • liuxiangxxl
  • 2017-08-08 09:55:39
  • 160

Python正则表达式中的常用符号

Python正则表达式中常用的符号简介正则表达式之所以叫做正则表达式,是因为他们可以识别正则字符串;源字一本书中的定义是:“如果你给我的字符串符合规则,我就返回它”,或者是“如果字符串不符合规则,我就...
  • qq_31258245
  • qq_31258245
  • 2017-11-28 22:25:46
  • 81

python正则表达式介绍及使用方法

元字符: 1.[ ]     常用来指定一个字符集:[abc]; [a-z]; [0-9]     元字符在字符集中不起作用:[akm$]     补集匹配不在区间范围内的字符:[^5] ; [^ab...
  • longshengguoji
  • longshengguoji
  • 2013-08-12 18:34:14
  • 3329

正则表达式用法 python

SOURCE: http://blog.csdn.net/whycadi/article/details/2011046 1.  Python正则式的基本用法 1.1基本规则 ...
  • feiyu07
  • feiyu07
  • 2017-04-15 17:56:40
  • 152

Python3之正则表达式详解

正则表达式 本节我们看一下正则表达式的相关用法,正则表达式是处理字符串的强大的工具,它有自己特定的语法结构,有了它,实现字符串的检索、替换、匹配验证都不在话下。 当然对于爬虫来说,有了它,...
  • qq_878799579
  • qq_878799579
  • 2017-06-06 21:20:10
  • 28111
收藏助手
不良信息举报
您举报文章:Python中正则表达式的使用
举报原因:
原因补充:

(最多只允许输入30个字)