Scrapy执行过程

最新推荐文章于 2024-01-11 00:03:38 发布

hehehero

最新推荐文章于 2024-01-11 00:03:38 发布

阅读量447

点赞数

分类专栏： python笔记文章标签： python

本文链接：https://blog.csdn.net/hehehero/article/details/109763535

版权

python笔记专栏收录该内容

6 篇文章 0 订阅

订阅专栏

Scrapy执行过程

Scrapy执行过程
（1）创建爬虫项目
scrapy startproject 项目名称
（2）创建爬虫文件
scrapy genspider 文件名称 域名
（3）settings.py设置文件中：
USER_AGENG = UA伪装
ROBOTSTXT_OBEY = False
LOG_LEVEL = 'ERROR'
（5）爬虫文件中解析数据，例如：
店铺信息 = 响应对象.xpath('//div[@class="abc"]/text()').extract()
#不要忘记
yield item
（4）items.py文件中定义属性，例如：
店铺信息 = scrapy.Field()
店铺地址 = scrapy.Field()
（5）爬虫文件中导入类，将item交给管道,例如：
from C001.items import C001Item
item = C001Item()
item['店铺名称'] = 店铺名称
yield item
（6）管道文件中pipelines.py中持久化存储，例如
店铺信息 = item['店铺信息']
数据 = pd.DataFrame()
数据.to_csv()
return item
（7）在设置中开始管道
（7）在设置中开始管道
（8）运行
scrapy crawl 爬虫文件名称

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

hehehero

关注关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
Scrapy执行过程

Scrapy执行过程Scrapy执行过程（1）创建爬虫项目scrapy startproject 项目名称（2）创建爬虫文件scrapy genspider 文件名称域名（3）settings.py设置文件中：USER_AGENG = UA伪装ROBOTSTXT_OBEY = FalseLOG_LEVEL = 'ERROR'（5）爬虫文件中解析数据，例如：店铺信息 = 响应对象.xpath('//div[@class="abc"]/text()').extract()#不要忘记y
复制链接

扫一扫