爬虫scrapy框架简单爬取一个网页

爬虫scrapy框架scrapy流程图开始一个scrapy项目首先进入你想要使用的虚拟环境,键入pip install scrapy下载完成后再虚拟环境中键入scrapy startproject 项目名称即可以在当前所在路径创建一个scrapy项目创建一个爬虫文件首先进入我们的scrapy项目cd 项目名这里我选择直接用命令行生成爬虫文件scrapy gensp...
摘要由CSDN通过智能技术生成

爬虫scrapy框架

scrapy流程图

在这里插入图片描述

开始一个scrapy项目

首先进入你想要使用的虚拟环境,键入

pip install scrapy

下载完成后再虚拟环境中键入

scrapy startproject 项目名称

在这里插入图片描述
即可以在当前所在路径创建一个scrapy项目

创建一个爬虫文件

首先进入我们的scrapy项目

cd 项目名

这里我选择直接用命令行生成爬虫文件

scrapy genspider 爬虫名 爬虫网页路径

在这里插入图片描述
现在我们新建了了一个爬虫文件

测试这个爬虫能不能爬到数据

同样的,我们可以用scrapy框架测试我们的项目

scrapy shell 爬虫网页路径

在这里插入图片描述
建立链接后键入

response.text

在这里插入图片描述
这里证明我们的链接可以获取到网页数据了

修改parse方法

现在我们回到pycharm中,看一下我们创建到的项目结构
在这里插入图片描述
版本原因可能有些scrapy版本不会自动创建middlewares,然后如果是python2.7的别忘记加utf-8编码格式
现在需要在项目中指定一下虚拟环境,这个和django差不多

  • 2
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值