正则表达式默认为贪婪算法,如果想关闭贪婪算法,只需在所要匹配的表达式后面加上?即可。
以上正则表达式是爬取东方财富网的股票信息,第一个括号([sh|sz].*?)中首先要匹配是深证股票还是上证,所以写成[sh|sz],而“.”可以匹配任何字符,星号代表这些字符应出现0次或者1次,而?则是消除贪婪算法,结束当前组的匹配。
另外还有特殊设置,比如DOTALL(也可以写成S)可以使得点号匹配任何字符包括换行,IGNORECASE(也可以写成I)匹配的时候不区分大小写,MULTILINE则使得^、$进行多行匹配。
对比一下上述两种情况,即可发现设置IGNORECASE之后,会忽略字母大小写。
python正则表达式学习笔记(二)
最新推荐文章于 2023-12-04 19:49:17 发布