ECommerceCrawlers之Scrapy详解(一)

2021SC@SDUSC

ECommerceCrawlers之Scrapy详解(一)

一、Scrapy框架简介

Scrapy的github主页介绍:

Scrapy 是一个快速的高级网络爬虫框架,用于抓取网站并从其页面中提取结构化数据。它可用于多种用途,比如数据挖掘监测和自动化测试。

二、Scrapy环境配置

1.安装python

这里建议安装python3.6-3.8之间的版本,因为最新的python版本可能会出现库不支持的情况。

2.pip install scrapy

命令行中输入

pip install scrapy

以安装scrapy

3.scrapy startproject xxxxxxxxx

命令行中输入

scrapy startproject xxxxxxxxx(你的scrapy项目名)

其中xxxxxxxxx为scrapy项目名,回车后可以创建一个Scrapy项目

三、Scrapy项目结构

xxxxxxxxx(你的scrapy项目名)/
    scrapy.cfg            # 部署配置文件

    tutorial/             # 项目的 Python 模块,你将从这里导入你的代码
        __init__.py

        items.py          #item定义文件(用于定义要爬取的数据的属性,其形式有点类似于JavaBean)

        middlewares.py    # 项目中间件文件

        pipelines.py      # 项目pipeline文件

        settings.py       # 项目设置文件

        spiders/          # 爬虫代码文件夹,里边是你自己编写的各种爬虫的代码
            __init__.py

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值