Scrapy安装及爬虫示例

wjcid

于 2021-07-29 11:44:42 发布

阅读量67

点赞数

分类专栏： python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/make_the_life/article/details/119206011

版权

python 专栏收录该内容

1 篇文章 0 订阅

订阅专栏

一、 Windows下载安装python3.9.6,配置环境变量

二、安装scrapy

cmd命令

pip install scrapy

三、创建运行项目

创建项目：

scrapy startproject pytest

注意：新建项目需要将settings.py配置文件的 ROBOTSTXT_OBEY = True 改为 False

示例：爬取百度首页

创建爬虫文件：scrapy genspider baidu-spider www.baidu.com

查看爬虫列表：scrapy list

爬虫文件代码示例：

import scrapy


class BaiduSpiderSpider(scrapy.Spider):
    name = 'baidu-spider'
    allowed_domains = ['www.baidu.com']
    start_urls = ['http://www.baidu.com/']

    def parse(self, response):
        print(response.text)
        pass

运行爬虫：scrapy crawl baidu-spider

wjcid

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Scrapy安装及爬虫示例

一、Windows下载安装python3.9.6,配置环境变量二、安装scrapycmd命令pip install scrapy三、创建运行项目创建项目：scrapy startproject pytest注意：新建项目需要将settings.py配置文件的 ROBOTSTXT_OBEY = True 改为 False示例：爬取百度首页创建爬虫文件：scrapy genspider baidu-spider www.baidu.com查看爬虫列表：scr...
复制链接

扫一扫

专栏目录