正则表达式:这是用来简洁表达一组字符串的表达式字符和操作符
优势:简洁
PY+表示以P开头后面有一个乃至无穷多个Y的表达式
“PY”开头,后续存在不多于10个字符,后续字符不能是“P”或“Y”
PY[^PY]{0,10}
正则表达式在文本处理中十分常用
表达文本类型的特征(病毒,入侵)
同时查找或替换一组字符串
匹配字符串的全部或部分
正则表达式的语法
re库的Match对象
match对象是一次运行的结果
match对象的方法:group(0),start(),end()
re库贪婪匹配和最小匹配
re库默认使用贪婪匹配,即最长匹配
最小匹配则需要加?
.表示任何单个字符,表示字符表上出现的任何字符。
[]是字符集,它对单个字符给出取值范围。如:[abc]表示a或b或c
[^]表示非字符集,给单个字符给出排除范围。如
[^abc]为非a或b或c的单个字符
表示前面一个字符0次到无数次扩展,如abc表示ab,abc,abc,abcc等
+表示前面一个字符1次到无数次扩展,如abc+表示abc,abc,abcc等
?表示前面一个字符0次或1次扩展,如abc?表示ab,abc
|表示左右表达式任一个,如abc|def表示abc或def
{m}表示扩展前面一个字符m次,如ab{2}c表示abbc
{m,n}表示扩展前面一个字符m到n次,如ab{1,2}c表示abc,abbc
匹配