项目遇到的一些问题

近期做的都是迭代项目,代码基本每个月都可以正常运行,只是如果突然加速,会导致某些网站数据拿取不到。故特地做一下总结,主要目的是为了提醒我自己:
1.爬虫迭代项目最好控制匀速爬取,不要突然大量提速,容易导致爬虫被识别到
2.代码的爬虫行为被网站检测到后,可能1-2小时左右,无法从网站拿取到数据,此时不要着急修改代码,可以先等上2小时候后再运行爬虫

基本每次突然大量提速,一些本来反爬比较严格的网站就会检测到我的异常行为,导致我的代码无法运行。但登上2小时后基本都可以正常爬取。少数情况需要修改代码!

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值