摘要:出现验证码一般是采集速度比较快、采集数据多,触发了网站的防采集机制所导致的。解决方案是由于其不确定性,并不是采集每一条数据都出现验证码。故需在规则中引入分支判断,对网页是否出现验证码进行判断。
采集过程碰到验证码怎么办?
验证码出现的时间不确定!
出现位置也不确定!
so我们要怎么解决呢?
原因:该情况一般是采集速度比较快、采集数据多,触发了网站的防采集机制所导致的。
解决方案:由于其不确定性,并不是采集每一条数据都出现验证码。故需在规则中引入分支判断,对网页是否出现验证码进行判断。如:出现时走左分支,不出现时走右分支。分支的判断一般可选择“当前页面包含文本”,具体请根据网页实际情况进行操作。分支判断的使用请参考相应教程,教程链接:https://www.bazhuayu.com/tutorial/judge
在配置规则的过程中,应采取先判断后识别验证码的流程顺序。此外,由于验证码不是时时出现,故一定要找到验证码出现的界面,从而完成“识别验证码”该步骤的建立。
操作示例:
1、按常规流程制作规则。