scrapy之爬虫初体验

最新推荐文章于 2024-08-05 10:37:56 发布

yihan.z

最新推荐文章于 2024-08-05 10:37:56 发布

阅读量1.6k

点赞数

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_33361618/article/details/80862746

版权

本文详述了如何创建并运行Scrapy项目，包括初始化项目、编写pipelines处理数据、利用items定义爬取结构以及使用xpath提取网页信息，并在settings.py中进行了相关配置。

摘要由CSDN通过智能技术生成

本篇文章主要将怎样创建一个scrapy项目，以及完成第一个scrapy爬虫项目。

首先是安装scrapy模块，有很多原因都能导致scrapy模块安装失败，网上有很多教程让怎样安装scrapy。亲测比较有效的方法使用whl文件安装。不过有小伙伴也可以尝试直接使用pip install scrapy命令进行直接装，运气好就能一次装成功。

第一步：创建一个爬虫项目：window系统下按住win+R组合键，然后在运行窗口输入cmd，打开命令行窗口。

回到你要创建的工作目录下，当然使用anaconda软件的小伙伴如果不想安装其他软件，想提高使用效果，还是把scrapy项目建在工作目录下，当然jupyter是可以改变工作目录的。ps:jupyter创建的文件后缀是.ipynb，但scrapy只识别和执行后缀为.py的文件。所以可以把写好的文件选择另存为.py文件：File-Download as-Python

我的工作目录为E:\Python\Python_work\scrapy，cmd执行命令下图所示：

最低0.47元/天解锁文章

关注

0
点赞
踩
8

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。