正则表达式

从一串字符串中提取数字,可以使用下面的方法,但是返回的是数组,而且打印出来也是带[ ]的,如果想返回数字本身,加上.group()

下表中其中?是1或者0,*是0或者多个,这就是区别 

  1. 使用正则表达式,用法如下:

    1

    2

    3

    4

    5

    6

    7

    8

    9

    10

    11

    12

    13

    ## 总结

    ## ^ 匹配字符串的开始。

    ## $ 匹配字符串的结尾。

    ## \b 匹配一个单词的边界。

    ## \d 匹配任意数字。

    ## \D 匹配任意非数字字符。

    ## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。

    ## x* 匹配0次或者多次 x 字符。

    ## x+ 匹配1次或者多次 x 字符。

    ## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。

    ## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。

    ## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。

    ## 正则表达式中的点号通常意味着 “匹配任意单字符”

  2. 解题思路:

    2.1 既然是提取数字,那么数字的形式一般是:整数,小数,整数加小数;

    2.2 所以一般是形如:----.-----;

    2.3 根据上述正则表达式的含义,可写出如下的表达式:"\d+\.?\d*";

    2.4 \d+匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字;\.?这个是匹配小数点的,可能有,也可能没有;\d*这个是匹配小数点之后的数字的,所以是0个或者多个;

  3. 代码如下:

    1

    2

    3

    4

    5

    6

    7

    # -*- coding: cp936 -*-

    import re

     

    string="A1.45,b5,6.45,8.82"

    print re.findall(r"\d+\.?\d*",string)

     

    # ['1.45', '5', '6.45', '8.82']

我想替换配置文件中的一个配置项的配置值,但是一直都不正确,网上搜到这个结果:

假如文本内容如下: 

1<string>1.0</string>

2<key>CFBundleSignature</key>
        
3<string>????</string>
        
4<key>CFBundleVersion</key>
        
5<string>10000</string>

如何用sed替换在某一行<string>与</string>中间的值, 比如第一行中间的值是1.0,我想替换为999,怎么去实现呢?  同样第3行、第5行、第n行可以有选择性地进行替换。

感谢楼下两位, 有选择性地去替换见下表达式,n代表行数。
sed -r 'n s/(<string>)[^<]*(<\/string>)/\1999\2/' 

其中

(<string>)为\1
(<\/string>)为\2

指前面中括号的内容,数字递增。

正则表达式中[]和()的区别

圆括号()是组,主要应用在限制多选结构的范围/分组/捕获文本/环视/特殊模式处理
示例:
1、(abc|bcd|cde),表示这一段是abc、bcd、cde三者之一均可,顺序也必须一致
2、(abc)?,表示这一组要么一起出现,要么不出现,出现则按此组内的顺序出现
3、(?:abc)表示找到这样abc这样一组,但不记录,不保存到$变量中,否则可以通过$x取第几个括号所匹配到的项,比如:(aaa)(bbb)(ccc)(?:ddd)(eee),可以用$1获取(aaa)匹配到的内容,而$3则获取到了(ccc)匹配到的内容,而$4则获取的是由(eee)匹配到的内容,因为前一对括号没有保存变量
4、a(?=bbb) 顺序环视 表示a后面必须紧跟3个连续的b
5、(?i:xxxx) 不区分大小写 (?s:.*) 跨行匹配.可以匹配回车符

方括号是单个匹配,字符集/排除字符集/命名字符集
示例:
1、[0-3],表示找到这一个位置上的字符只能是0到3这四个数字,与(abc|bcd|cde)的作用比较类似,但圆括号可以匹配多个连续的字符,而一对方括号只能匹配单个字符
2、[^0-3],表示找到这一个位置上的字符只能是除了0到3之外的所有字符

()和[]有本质的区别
()内的内容表示的是一个子表达式,()本身不匹配任何东西,也不限制匹配任何东西,只是把括号内的内容作为同一个表达式来处理,例如(ab){1,3},就表示ab一起连续出现最少1次,最多3次。如果没有括号的话,ab{1,3},就表示a,后面紧跟的b出现最少1次,最多3次。另外,括号在匹配模式中也很重要。这个就不延伸了,LZ有兴趣可以自己查查
[]表示匹配的字符在[]中,并且只能出现一次,并且特殊字符写在[]会被当成普通字符来匹配。例如[(a)],会匹配(、a、)、这三个字符。

所以() [] 无论是作用还是表示的含义,都有天壤之别

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值