python爬虫之scrapy之入门实例

最新推荐文章于 2021-05-22 21:10:05 发布

giunwr

最新推荐文章于 2021-05-22 21:10:05 发布

阅读量269

点赞数

分类专栏： python 文章标签： python 爬虫 scrapy

本文链接：https://blog.csdn.net/qq_44105778/article/details/86597142

版权

python 专栏收录该内容

36 篇文章 1 订阅

订阅专栏

scrapy之入门实例

首先我们需要参加一个scrapy工程
打开cmd输入

scrapy startproject 工程名

可以看到生成一个文件夹里面有以下图中文件
在这里插入图片描述

各个文件介绍

其次在工程中产生一个爬虫

scrapy genspider demo python123.io
//生产名为demo的爬虫

然后会生产一个demo.py文件
在这里插入图片描述
demo.py的内容

然后配置产生的spdier爬虫

# -*- coding: utf-8 -*-
import scrapy


class DemoSpider(scrapy.Spider):
    name = 'demo'
    # allowed_domains = ['python123.io']
    start_urls = ['http://python123.io/ws/demo.html']

    def parse(self, response):
        fname = response.url.split('/')[-1]
        with open(fname,'wb') as f:
            f.write(response.body)
        self.log('Saved file %s.'% fname)

最后执行demo.py