参考资料:Python网络爬虫与信息提取(北京理工大学慕课)
实例:
同时匹配长短不同的多项,返回哪一个呢?
贪婪匹配
Re库默认采用贪婪匹配,即输出匹配最长的子串:
最小匹配
如何输出最短的子串呢?
最小匹配在贪婪匹配的基础上进行了扩展,也就是说Re库中,如果你希望得到最小匹配,你需要对以下四个操作符进行扩展:
最小匹配操作符:
操作符 | 说明 |
---|
*? | 前一个字符0次或无限次扩展,最小匹配 |
+? | 前一个字符1次或无限次扩展,最小匹配 |
?? | 前一个字符0次或1次扩展,最小匹配 |
{m, n}? | 扩展前一个字符m至n次(含n),最小匹配 |