Scrapy框架爬取详细步骤

本文详细介绍了如何使用Scrapy框架进行网络爬虫的开发,包括创建项目、编写爬虫代码、设置Item和Settings,以及运行爬虫进行数据抓取和存储。通过实例演示了从创建爬虫文件、配置URL、解析网页、定义存储项到启用下载管道的过程。
摘要由CSDN通过智能技术生成

Scrapy框架

(本文只做学习使用,请勿他用)


1.需求工具 pycharm 小说网的域名 (www.qisuu.com)

第一步—–创建文件

创建成功后显示如图:

这里写图片描述


第二步——将创建在桌面上的scrapy文件用pycharm打开:

这是创建成功后在pycharm中的显示

这里写图片描述

pycharm左下角打开 Terminal

这里写图片描述

打开后如图 我第一次键入了一条命令 提示爬虫名字不能和项目名称一样,更改后再运行..成功建立爬虫文件 booksspider
创建爬虫文件命令: scrapy+ genspider+ 蜘蛛名称 +网站域名

这里写图片描述

创建成功后,出现爬虫文件:

这里写图片描述


接下来,就可以在爬虫文件中写爬虫代码了

第三步——–编写爬虫代码

1.红框框起来的头部 有
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值