今天在做百度搜索的搜索页爬虫,各类元素都很好找,但是请求了三四次就返回百度安全验证,找不到页面
就是这样的返回响应
在网上也找了很多方法,包括但不限于(requests库更换urllib.request库,更换代理,加入cookie,添加force_refresh参数,更换http请求)
有的虽然可行,但是请求了一两次就直接寄了,大家有没有什么比较稳定的方法?
百度的安全验证逻辑应该就是某个ip多次请求会给你封一段时间吧
目前加了代理,并且更改了一些其他功能,第一次请求反正没问题,不知道后来怎么样
功能,第一次请求反正没问题,不知道后来怎么样
