爬虫scrapy框架简单爬取一个网页

最新推荐文章于 2024-05-13 00:51:49 发布

lvbu89757

最新推荐文章于 2024-05-13 00:51:49 发布

阅读量1.2k

点赞数 2

分类专栏：爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lvbu89757/article/details/96966268

版权

爬虫scrapy框架scrapy流程图开始一个scrapy项目首先进入你想要使用的虚拟环境，键入pip install scrapy下载完成后再虚拟环境中键入scrapy startproject 项目名称即可以在当前所在路径创建一个scrapy项目创建一个爬虫文件首先进入我们的scrapy项目cd 项目名这里我选择直接用命令行生成爬虫文件scrapy gensp...

摘要由CSDN通过智能技术生成

爬虫scrapy框架

scrapy流程图

在这里插入图片描述

开始一个scrapy项目

首先进入你想要使用的虚拟环境，键入

pip install scrapy

下载完成后再虚拟环境中键入

scrapy startproject 项目名称

在这里插入图片描述
即可以在当前所在路径创建一个scrapy项目

创建一个爬虫文件

首先进入我们的scrapy项目

cd 项目名

这里我选择直接用命令行生成爬虫文件

scrapy genspider 爬虫名 爬虫网页路径

在这里插入图片描述
现在我们新建了了一个爬虫文件

测试这个爬虫能不能爬到数据

同样的，我们可以用scrapy框架测试我们的项目

scrapy shell 爬虫网页路径

在这里插入图片描述
建立链接后键入

response.text

在这里插入图片描述
这里证明我们的链接可以获取到网页数据了

修改parse方法

现在我们回到pycharm中，看一下我们创建到的项目结构
在这里插入图片描述
版本原因可能有些scrapy版本不会自动创建middlewares，然后如果是python2.7的别忘记加utf-8编码格式
现在需要在项目中指定一下虚拟环境，这个和django差不多

最低0.47元/天解锁文章

关注

2
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
爬虫scrapy框架简单爬取一个网页

爬虫scrapy框架scrapy流程图开始一个scrapy项目首先进入你想要使用的虚拟环境，键入pip install scrapy下载完成后再虚拟环境中键入scrapy startproject 项目名称即可以在当前所在路径创建一个scrapy项目创建一个爬虫文件首先进入我们的scrapy项目cd 项目名这里我选择直接用命令行生成爬虫文件scrapy gensp...
复制链接

扫一扫

专栏目录

lvbu89757 CSDN认证博客专家 CSDN认证企业博客

码龄7年

74: 原创

6万+: 周排名

170万+: 总排名

14万+: 访问

: 等级

1704: 积分

16: 粉丝

30: 获赞

5: 评论

145: 收藏

私信

关注

热门文章

分类专栏

最新评论

numpy 通用函数
跑得动: 找到一个不用钱的https://blog.csdn.net/qq_44767279/article/details/116606961?ops_request_misc=%257B%2522request%255Fid%2522%253A%2522171880190116800211540648%2522%252C%2522scm%2522%253A%252220140713.130102334..%2522%257D&request_id=171880190116800211540648&biz_id=0&utm_medium=distribute.pc_search_result.none-task-blog-2~all~top_positive~default-1-116606961-null-null.142^v100^pc_search_result_base1&utm_term=头歌NumPy通用函数&spm=1018.2226.3001.4187
numpy 通用函数
跑得动: 还收费呢能给你赚几个子，祝做啥都少气运
django改变用户头像
嘁哩喀喳2: fdfs_storage 是什么东西来的？？？？？
numpy 数组的增加，删除，插入，合并
Tisfy: Nice!,古人云：黄沙百战穿金甲，不破楼兰终不还。
django 后端用户权限和验证方式补充
Greg955: 做“加法”的路过~

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。