首先需要明确分组的概念,即正则中的()中的内容是一个分组,里面的内容作为一个整体引用。如果在分组后面接上“\数字”,表示匹配第几个分组。
比如说,
正则中的分组有(abc)、(bcd),这时如果使用\1将会匹配第一个分组中的内容即abc,如果是\2就匹配bcd。
在python中的replace函数中,比如df.replace([r'(abc)',r'(bc)(d)'],[r'\1aaa','\2ttt'],regex=True)
替换结果是abc替换为abcaaa,bcd替换为dttt。