Scrapy-爬虫
文章平均质量分 88
艾希逐月
帘外芭蕉惹骤雨门环惹铜绿
展开
-
Scrapy 入门学习笔记(1) -- Scrapy 项目搭建与架构介绍
最近学习用 Scrapy 框架写爬虫,简单来说爬虫就是从网上抓取网页,解析网页,然后进行数据的存储与分析,将从网页的解析到数据的转换存储。将学习过程中用到的解析技术,Scrapy 的各个模块使用与进阶到分布式爬虫学到的知识点、遇到的问题以及解决方法记录于此,以作总结与备忘,也希望对需要的同学有所帮助。原创 2017-05-12 08:37:03 · 1276 阅读 · 0 评论 -
Scrapy 入门学习笔记(2) -- xpath 与 css 解析以及解析网页示例
最近学习用 Scrapy 框架写爬虫,简单来说爬虫就是从网上抓取网页,解析网页,然后进行数据的存储与分析,将从网页的解析到数据的转换存储。将学习过程中用到的解析技术,Scrapy 的各个模块使用与进阶到分布式爬虫学到的知识点、遇到的问题以及解决方法记录于此,以作总结与备忘,也希望对需要的同学有所帮助。本篇主要讲解 xpath 、css 解析网页的语法以及在 Scrapy 中的使用原创 2017-05-15 20:33:24 · 11508 阅读 · 1 评论 -
Scrapy 入门学习笔记(3) -- 使用 Item 类转换传输数据以及ItemLoader 机制解析
最近学习用 Scrapy 框架写爬虫,简单来说爬虫就是从网上抓取网页,解析网页,然后进行数据的存储与分析,将从网页的解析到数据的转换存储。将学习过程中用到的解析技术,Scrapy 的各个模块使用与进阶到分布式爬虫学到的知识点、遇到的问题以及解决方法记录于此,以作总结与备忘,也希望对需要的同学有所帮助。本篇主要讲解 Item 类封装数据以及 ItemLoader 加载数据机制。原创 2017-05-18 14:02:16 · 6177 阅读 · 0 评论 -
Scrapy 入门笔记(4) --- 使用 Pipeline 保存数据
最近学习用 Scrapy 框架写爬虫,将学习过程中用到的解析技术,Scrapy 的各个模块使用与进阶到分布式爬虫学到的知识点、遇到的问题以及解决方法记录于此,以作总结与备忘,也希望对需要的同学有所帮助。本篇主要讲解 pipeline 保存数据模块的使用,包括将数据存储为 Json 文件,存储到 MySQL 数据库以及图片的下载原创 2017-05-18 15:57:48 · 23242 阅读 · 6 评论