re模块中的sub可以进行字符替换
先看一个例子,把lan
字符串中的C#
替换成C++
import re
lan = 'PythonC#JavaC#PHPC#'
r = re.sub('C#','C++',lan)
print(r)
-----------------------------------
输出: PythonC++JavaC++PHPC++
++++++++++++++++++++++++++++++++++++++++++++++++++++
也可以用Python的内置函数进行替换
lan = 'PythonC#JavaC#PHPC#'
r = lan.replace('C#','C++')
print(r)
--------------------------------------------
输出: PythonC++JavaC++PHPC++
re.sub
的第三个参数是count
匹配之后所能被替换的最大次数,默认为0
,0
表示满足这样的一个匹配将无限次的替换下去.
我们只想匹配掉第一个
C#
,re.sub
的第三个参数就有作用了
import re
lan = 'PythonC#JavaC#PHPC#'
r = re.sub('C#','C++',lan,1)
print(r)
-------------------------------
输出:
PythonC++JavaC#PHPC#
re.sub
的第二个参数可以是一个函数
def convert(value):
print(value)
import re
lan = 'PythonC#JavaC#PHPC#'
r = re.sub('C#',convert,lan)
--------------------------------------------
匹配到的结果c#会传到这个函数里面来,value是一个对象,打印的value是:
<_sre.SRE_Match object; span=(6, 8), match='C#'>
<_sre.SRE_Match object; span=(12, 14), match='C#'>
<_sre.SRE_Match object; span=(17, 19), match='C#'>
注:因为有3个C#
所以,匹配掉lan
字符串中的C#
,convert
函数就可以这样写:
def convert(value):
matched = value.group()
return '!!' + matched + '!!'
import re
lan = 'PythonC#JavaC#PHPC#'
r = re.sub('C#',convert,lan)
print(r)
----------------------------------------------
输出:
Python!!C#!!Java!!C#!!PHP!!C#!!