自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

python开发

文章平均质量分 86
关注数:0 文章数:1 文章阅读量:18426 文章收藏量:656

作者: 学Python的阿勇

1、熟练掌握爬虫requests. scrapy. scrapy-redis爬虫流程,掌握正则表达式、xpath提取网页资源方法,熟练构建分布式爬虫, Linux下的定时启动爬虫 2、熟悉各个网站常见反爬策略,能根据网页分析出常见反爬手段 3、熟悉前游代码,可以分析目标网站真实request地址和response内容,使用代理试水网站反爬由级别,检测是否有投毒数据。 4、针对不同反爬虫级别网站,做出具体Scrapy部署,使用工具包括不局限于:伪造User-Agent,批量P代理池,设置并发数量及下载速度 5、使用logging模块编写监控程序进行爬虫监控,并根据日期定向输出日志到og文件
展开