1.验证码 1.1 IP获取 1.2Cookie登陆 1.3传统识别 1.31 人工打码 1.32滑动验证码 二、Scrapy 爬虫框架 2.1爬虫模块 2.2选择器 2.3item pipeline 激活 2.4内置图片和文件下载方式 2.5继承 三、深入爬虫 1.流程 2.scrapy.Spider 2.CrawlSpider 3.XMLFeedSpider 4.Item Loader 5.内置处理器 四、对象 2.response 对象 ** 3.下载中间件 ** 4. spider 中间件 五、扩展 5.突破反爬虫 6.突破方法