最近,该公司在一个网站群研究课程中报告了一项活动,即收集网络数据库和使用网站域名软件收集百度搜索以筛选数据。 老板说如果他这样做,就会有慷慨的奖金我在听奖金!?我要参加,不是别的,为了价格,哈哈哈 -我不知道。我发现百度的防爬行机制真的很严格,加密层和验证码很难破解,我知道这会很困难,否则公司不会说是奖金。老大,那个老贼。 谁叫我程序员?你不必害怕所有的困难,走吧我不知道 所以我在网上寻找解决方案。 在网上但是很多信息都是无用的,这简直是一个选择我不知道 经过三天三夜的成功,这个代码真的很难! 后来我加入搜狗、360、神马、bing等搜索引擎同时启动,多线程采集。 速度也得到了几次优化。我很高兴,这个价格不是我的!真的不能放弃,否则这个机会可能是别人的,哎哎哎。