访问时间间隔/获取数据限制
可以通过time.sleep()解决
在获取页面之前延迟一秒,在获取之后再延迟一秒
每次访问新页面前加入
header = {
'user-agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/60.0.3112.113 Safari/537.36'}
如上能够破解部分反爬虫机制
另外,不推荐在主页进行循环获取分页,不设置延迟会被检测到,设置了会拖慢时间,建议自己手动输入
有VPN之类的无限换IP的用户请忽略