python 正则表达式笔记1

(1)  import re

(2) .号(点号)表示出了换行符之外的所有字符

re.search(r'love','i love you')

(3) 如果要匹配"."(点号)加上反斜杠"\",如:

re.search('\.','i love you.com')
<_sre.SRE_Match object; span=(10, 11), match='.'>

\d可以匹配一个数字,\w可以匹配一个字母或数字

(4) 简易匹配ip地址

re.search(r'\d\d\d.\d\d\d.\d\d\d.\d\d\d','192.168.111.222')

(5)字符类[]

re.search(r'[aeiou]','I love you')

_sre.SRE_Match object; span=(3, 4), match='o'>

(6)"-" (下划线)表示范围

re.search(r'[0-9]','I love 123.com')

<_sre.SRE_Match object; span=(7, 8), match='1'>

(7)大括号{}里面的数字表示大括号前面的字符重复的次数,如:

re.search(r'ab{3}c','hello abbbcd')

<_sre.SRE_Match object; span=(6, 11), match='abbbc'>

 

3到10个b都会匹配

re.search(r'ab{3,10}c','abbbbc')

<_sre.SRE_Match object; span=(0, 6), match='abbbbc'>

 

(8)匹配IP地址:

re.search(r'(([01]{0,1}\d{0,1}\d{0,1}|2[0-4]\d||25[0-5])\.){3}([01]{0,1}\d{0,1}\d{0,1}|2[0-4]\d||25[0-5])','192.168.1.1')
(9)A|B 匹配表达式A或B,例如

re.search('L(i|y)','Li')

(10)^ 匹配输入字符串的开始位置

re.search(r'I lov','I love you')

(11)$匹配输入字符串的结束为止

re.search(r'ok$','i loe ok')

(12)\跟上数字,有两种表达方式,

       12.1 数字在1-99范围内表示引用序列对应词组所匹配的字符串

          re.search(r'(Lucy)\1','LucyLucy')

         <_sre.SRE_Match object; span=(0, 8), match='LucyLucy'>

        re.search(r'(Lucy)and(Lily)\2','LucyandLilyLily')

        <_sre.SRE_Match object; span=(0, 15), match='LucyandLilyLily'>

      12.2 如果跟着的数字是0开头或者3位的数字的长度,那么它是一个八进制数,八进制数字对于的ascii所对应的字符

       re.search(r'(Lucy)\060','helloLucy0')

      <_sre.SRE_Match object; span=(5, 10), match='Lucy0'>

     re.search(r'(jackson)\141','jacksona')

    <_sre.SRE_Match object; span=(0, 8), match='jacksona'>

(13)[]字符类里面的内容,都当成普通的字符(除了几个特殊的字符,-:表示范围;\:字符串的转义符)

    13.1  re.search(r'[.]','hello baidu.com')

   <_sre.SRE_Match object; span=(11, 12), match='.'>

   13.2 特殊字符-       re.findall(r'[a-z]','Hello')

      ['e', 'l', 'l', 'o']

   13.3 特殊字符\  

        re.findall(r'[\n]','love you forever\n')

       ['\n']

   13.4 特殊字符,脱字符^

     13.4.1 表示取反(放在前面),表示不包括其中的任意字符

      re.findall(r'[^a-z]','Love you!')

       ['L', ' ', '!']

      还例如:

       re.search(r'[^"]+\.jpg','"http://a.jpg')

       <_sre.SRE_Match object; span=(1, 13), match='http://a.jpg'>

    13.4.2 表示脱字符本身(放在后面)

     re.findall(r'[a-z^]','My name is jack')

    ['y', 'n', 'a', 'm', 'e', 'i', 's', 'j', 'a', 'c', 'k']

 

     14.字符重复{m,n},例如

    re.search(r'Love{3}','Loveee you')

   <_sre.SRE_Match object; span=(0, 6), match='Loveee'>

  re.search(r'(love){3}','lovelovelovey')

<_sre.SRE_Match object; span=(0, 12), match='lovelovelove'>

 

15.正则表达式默认使用贪婪的模式:只要符合的条件下,会尽可能多的去匹配

s='<html><title>I love you</title></html>'

re.search(r'<.+',s)

_sre.SRE_Match object; span=(0, 38), match='<html><title>I love you</title></html>'>

  15.1 启用飞贪婪模式

     re.search(r'<.+?>',s)

    <_sre.SRE_Match object; span=(0, 6), match='<html>'>

 

转载于:https://my.oschina.net/u/229425/blog/727545

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值