用正则表达式读取精灵标注的xml文件
正则表达式是对字符串进行模糊匹配,提取自己需要的字符串部分,re模块是python独有的匹配字符串的模块,该模块在python中用于实现正则表达式。
一、re.findall函数
参数:
- pattern:正则表达式
- string:需要匹配的内容
- flags:匹配模式,默认flags=0
返回string中所有与pattern匹配的全部字符串,返回形式为列表。
例:
str = 'ababbabaabbaab'
out = re.findall('ab',str)
#['ab', 'ab', 'ab', 'ab', 'ab']
二、re.findall的正则表达式
- 符号 . 就 是匹配除 \n (换行符)以外的任意一个字符
str = 'ababbabaabbaab'
out = re.findall('a.b',str)
#['abb', 'aab', 'aab']
- 符号*前面的字符出现0次或以上
str = 'ababbabaabbaab'
out = re.findall('a*b',str)
#['ab', 'ab', 'b', 'ab', 'aab', 'b', 'aab']
- 贪婪,匹配从.*前面为开始到后面为结束的所有内容
str =