python之淘宝商品信息定向爬虫实例

最新推荐文章于 2024-07-25 19:59:32 发布

Richard678

最新推荐文章于 2024-07-25 19:59:32 发布

阅读量471

点赞数

分类专栏： python

原文链接：www.baidu.com

版权

python 专栏收录该内容

32 篇文章 0 订阅

订阅专栏

第一步：建立scrapy爬虫工程

D:\tmp>scrapy startproject pythondemo

第二步：在工程中产生一个爬虫

D:\tmp\pythondemo>scrapy genspider demo python123.io

第三步：配置产生的spider爬虫

# -*- coding: utf-8 -*-
import scrapy


class DemoSpider(scrapy.Spider):
    name = 'demo'
    #allowed_domains = ['python123.io']
    start_urls = ['http://python123.io/ws/demo.html']

    def parse(self, response):
        fname=response.url.split('/')[-1]#响应的url的名字为本地文件名
        with open(fname,'wb') as f:
            f.write(response.body)
        self.log('Saved file %s.'% name)        
        pass

第四步：运行爬虫