在写爬虫的正则时,不明白加不加?为什么区别这么大,在网上搜了半天,看到下面这个例子,一下子就明白了,特别拿出来分享
源字符串:aa<div>test1</div>bb<div>test2</div>cc
正则表达式一:<div>.*</div>
匹配结果一:<div>test1</div>bb<div>test2</div>
正则表达式二:<div>.*?</div>
匹配结果二:<div>test1</div>(这里指的是一次匹配结果,所以没包括<div>test2</div>,而贪婪是把能匹配进去的全部都匹配进去了)