![](https://img-blog.csdnimg.cn/20201014180756919.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
scrapy网络爬虫
Three123v
这个作者很懒,什么都没留下…
展开
-
精通scrapy网络爬虫——第三章 response.xpath()and css()基础语法
首先创建一个用于演示的HTML文档,并构造一个HtmlResponse对象from scrapy.selector import Selectorfrom scrapy.http import HtmlResponsebody = '''<html> <head> <base href='http://example.com/' /&...原创 2019-11-07 22:42:41 · 3317 阅读 · 1 评论 -
精通scrapy网络爬虫 第三章———利用selector提取数据
创建对象#创建Selector 对象from scrapy.selector import Selectortext = '''<html> <body> <h1>Hello World</h1> <h1>Hello Scrapy</h1> <h1>...原创 2019-11-07 22:30:29 · 664 阅读 · 0 评论 -
精通scrapy网络爬虫第一章example
import scrapyclass BooksSpider(scrapy.Spider): # 每一个爬虫的唯一标识 name = 'books' # 定义爬虫爬取的起始点,起始点可以是多个,这里只有一个 start_urls = ['http://books.toscrape.com/'] def parse(self, response):...原创 2019-11-07 18:49:44 · 286 阅读 · 0 评论