在看python基础教程的时候,遇到这样一个正则表达式:
a = re.sub(r'\*(.+?)\*', r'<em>\1</em>', '*d6*')
通过看书和网上找资料,大概弄明白一些。
1、在正则表达式中,要表达字符本身,在模式中要加转义字符\,并且前面要有个r,如果没有r,那要再加一个\,即\\*
2、+重复运算符默认是贪婪模式,在后面加个?,就是非贪婪模式
3、(.+?)这个小括号表示一个组,\1表示引用了这个分组的值
4、sub(pattrn,replacement,string),这个函数意思是string符合pattrn中的内容,会被replacement替换掉,返回新的字符串
5、 re.sub(r'\*(.+?)\*', r'<em>\1</em>', '*d6*'),*d6*和模式匹配上了,*d6*都会被<em>\1</em>替换掉,\1的值来自分组(.+?),即d6,因此会返回新字符串<em>d6</em>