从一串字符串中提取数字,可以使用下面的方法,但是返回的是数组,而且打印出来也是带[ ]的,如果想返回数字本身,加上.group()
下表中其中?是1或者0,*是0或者多个,这就是区别
-
使用正则表达式,用法如下:
1
2
3
4
5
6
7
8
9
10
11
12
13
## 总结
## ^ 匹配字符串的开始。
## $ 匹配字符串的结尾。
## \b 匹配一个单词的边界。
## \d 匹配任意数字。
## \D 匹配任意非数字字符。
## x? 匹配一个可选的 x 字符 (换言之,它匹配 1 次或者 0 次 x 字符)。
## x* 匹配0次或者多次 x 字符。
## x+ 匹配1次或者多次 x 字符。
## x{n,m} 匹配 x 字符,至少 n 次,至多 m 次。
## (a|b|c) 要么匹配 a,要么匹配 b,要么匹配 c。
## (x) 一般情况下表示一个记忆组 (remembered group)。你可以利用 re.search 函数返回对象的 groups() 函数获取它的值。
## 正则表达式中的点号通常意味着 “匹配任意单字符”
-
解题思路:
2.1 既然是提取数字,那么数字的形式一般是:整数,小数,整数加小数;
2.2 所以一般是形如:----.-----;
2.3 根据上述正则表达式的含义,可写出如下的表达式:"\d+\.?\d*";
2.4 \d+匹配1次或者多次数字,注意这里不要写成*,因为即便是小数,小数点之前也得有一个数字;\.?这个是匹配小数点的,可能有,也可能没有;\d*这个是匹配小数点之后的数字的,所以是0个或者多个;
-
代码如下:
1
2
3
4
5
6
7
# -*- coding: cp936 -*-
import
re
string
=
"A1.45,b5,6.45,8.82"
print
re.findall(r
"\d+\.?\d*"
,string)
# ['1.45', '5', '6.45', '8.82']
我想替换配置文件中的一个配置项的配置值,但是一直都不正确,网上搜到这个结果:
假如文本内容如下:
1<string>1.0</string>
2<key>CFBundleSignature</key>
3<string>????</string>
4<key>CFBundleVersion</key>
5<string>10000</string>
如何用sed替换在某一行<string>与</string>中间的值, 比如第一行中间的值是1.0,我想替换为999,怎么去实现呢? 同样第3行、第5行、第n行可以有选择性地进行替换。
感谢楼下两位, 有选择性地去替换见下表达式,n代表行数。
sed -r 'n s/(<string>)[^<]*(<\/string>)/\1999\2/'
其中
(<string>)为\1
(<\/string>)为\2
指前面中括号的内容,数字递增。
正则表达式中[]和()的区别
圆括号()是组,主要应用在限制多选结构的范围/分组/捕获文本/环视/特殊模式处理
示例:
1、(abc|bcd|cde),表示这一段是abc、bcd、cde三者之一均可,顺序也必须一致
2、(abc)?,表示这一组要么一起出现,要么不出现,出现则按此组内的顺序出现
3、(?:abc)表示找到这样abc这样一组,但不记录,不保存到$变量中,否则可以通过$x取第几个括号所匹配到的项,比如:(aaa)(bbb)(ccc)(?:ddd)(eee),可以用$1获取(aaa)匹配到的内容,而$3则获取到了(ccc)匹配到的内容,而$4则获取的是由(eee)匹配到的内容,因为前一对括号没有保存变量
4、a(?=bbb) 顺序环视 表示a后面必须紧跟3个连续的b
5、(?i:xxxx) 不区分大小写 (?s:.*) 跨行匹配.可以匹配回车符
方括号是单个匹配,字符集/排除字符集/命名字符集
示例:
1、[0-3],表示找到这一个位置上的字符只能是0到3这四个数字,与(abc|bcd|cde)的作用比较类似,但圆括号可以匹配多个连续的字符,而一对方括号只能匹配单个字符
2、[^0-3],表示找到这一个位置上的字符只能是除了0到3之外的所有字符
()和[]有本质的区别
()内的内容表示的是一个子表达式,()本身不匹配任何东西,也不限制匹配任何东西,只是把括号内的内容作为同一个表达式来处理,例如(ab){1,3},就表示ab一起连续出现最少1次,最多3次。如果没有括号的话,ab{1,3},就表示a,后面紧跟的b出现最少1次,最多3次。另外,括号在匹配模式中也很重要。这个就不延伸了,LZ有兴趣可以自己查查
[]表示匹配的字符在[]中,并且只能出现一次,并且特殊字符写在[]会被当成普通字符来匹配。例如[(a)],会匹配(、a、)、这三个字符。
所以() [] 无论是作用还是表示的含义,都有天壤之别