在学习Python写爬虫时用到正则表达式是必然的,因此有效掌握正则表达式这门神器会使我们爬虫工作如鱼得水,不过在成长为大神之前还是有很多弯路要走,希望自己一路打怪升级早日成为大神。
闲话少叙,今天写爬虫的时候发现要匹配一个跨很多很多行的内容,之前是(.+?)在手,爬虫我有,不过这次这个神匹配也不好使了,查了点资料,发现是(.)不能匹配跨行内容,ok,上利器,[\s\S]* or [\w\W]* or [\d\D]*。搞定。汗。其实并没有,还在解决中,只是觉得这是个好东西,赶紧写下来记录一下。