这本书解释了Python的引入爬虫从三个维度。:技术维度:详细解释Python web爬虫程序的核心技术,包括网络爬虫的工作原理,如何使用urllib库编写web爬虫程序,和爬虫的异常处理,正则表达式,使用cookie的爬虫,浏览器爬虫伪装技术,定向抓取技术,anti-crawler技术,以及如何编写web爬虫程序自己;工具维度:以流行的Python web爬虫框架Scrapy为对象,详细解释了使用Scrapy、高级技能、架构设计、实现原则,以及如何使用Scrapy编写web爬虫程序更加方便和高效;实战维度:实际combat-oriented,是这本书的主题,除了它是通过手动编程。除了web爬虫程序的实际情况和web爬虫通过Scrapy框架的实现。
有些人可能会发现很难开始使用Python爬虫,但只要我们选择合适的教师,发现至少有一个正确的学习书,然后开始使用Python爬虫并不那么困难。像上面的书我分享,很容易理解,适合初学者。