scrapy 基础入门

最新推荐文章于 2023-10-24 15:30:00 发布

黄金万两hjy

最新推荐文章于 2023-10-24 15:30:00 发布

阅读量37

点赞数 1

文章标签： scrapy

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_73981368/article/details/132226559

版权

1. 创建项目

scrapy startproject 项目名称

2. 进入项目

cd 项目名称

3. 创建爬虫

scrapy genspider 名字域名

4. 可能需要修改start_urls, 修改成你要抓取的页面

5. 对数据进行解析,在spider里面parse(reponse)方法中进行解析

def parse(self, respones):

respone.text 拿页面源代码

respone.xpath()

respone.css()

解析数据的时候,需要注意,默认xpath( )返回的是Selector对象

想要数据必须使用extract( )提取数据

extract() 返回列表

extract_fist() 返回一个数据

yield 返回数据 -> 把数据交给pipeline来进行持久化存储

6. 在pipeline中完成存储数据

class 类名():

def process_item(self, item,spider):

item: 数据

spider:爬虫

# 往数据里面再添加数据

item['你的数据的key']='数据的值'

return item # 必须要return东西,否则下一个管道收不到数据

7. 设置settings.py文件将pipeline进行生效设置

ITEM_PIPELINES ={

#优先级越小,最新执行

'管道路径': 优先级,

'管道路径': 优先级,

}

8. 运行爬出

scrapy crawl 爬虫的名字

黄金万两hjy

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
scrapy 基础入门

return item # 必须要return东西,否则下一个管道收不到数据。解析数据的时候,需要注意,默认xpath( )返回的是Selector对象。yield 返回数据 -> 把数据交给pipeline来进行持久化存储。5. 对数据进行解析,在spider里面parse(reponse)方法中进行解析。item['你的数据的key']='数据的值'想要数据必须使用extract( )提取数据。extract_fist() 返回一个数据。'管道路径': 优先级,'管道路径': 优先级,
复制链接

扫一扫

黄金万两hjy CSDN认证博客专家 CSDN认证企业博客

码龄2年

13: 原创

152万+: 周排名

9万+: 总排名

6001: 访问

: 等级

272: 积分

85: 粉丝

139: 获赞

8: 评论

120: 收藏

私信

关注

热门文章

最新评论

我的世界-自定义剑
CSDN-Ada助手: 恭喜您撰写了第13篇博客“我的世界-自定义剑”！您对自定义剑的探索和创作展现了对游戏的热爱和创造力。希望您能继续保持创作的热情，不断探索游戏中更多有趣的内容。或许下一步可以尝试探索其他装备或建筑的自定义，给游戏带来更多新鲜感。期待您的下一篇作品！
机器学习01
CSDN-Ada助手: 不知道 Python入门技能树是否可以帮到你：https://edu.csdn.net/skill/python?utm_source=AI_act_python
进入Hive
CSDN-Ada助手: 恭喜您写出了第8篇博客！标题“进入Hive”让我对您的内容产生了浓厚的兴趣。不断创作是提升自己的重要一步，您的坚持值得赞赏。接下来，我希望您能够在博客中深入探讨Hive的核心概念和应用案例，或者分享一些关于Hive的实用技巧和最佳实践。这样的话，读者们可以更好地了解和应用Hive，同时也能更好地从您的博客中受益。期待您的下一篇文章！
pandas增删改查
CSDN-Ada助手: 非常棒的博客！恭喜你写了第7篇博客，并且选择了一个非常实用的主题——"pandas增删改查"。你的文章内容很明确，解释了如何在pandas中进行增删改查操作。我很高兴看到你不断创作并分享这些有用的信息。对于下一步的创作建议，我认为你可以考虑探索更多pandas的高级功能。比如，你可以介绍如何使用pandas进行数据清洗、数据聚合和数据分析等方面的操作。此外，你还可以分享一些使用pandas解决实际问题的案例，这将进一步增加你的博客的实用性和吸引力。继续保持创作，期待看到更多精彩的文章！谦虚的态度和分享精神将会带给你更多的成功。加油！
pandas高级数据处理
CSDN-Ada助手: 恭喜您发布了新的博客！对于pandas高级数据处理的探索，我非常期待能够从您的分享中学到更多知识。或许在下一篇博客中，您可以分享一些实际案例，或者对于某些复杂问题的解决方案，这样可以更好地帮助读者理解和应用这些高级数据处理技巧。期待您的下一篇精彩作品！

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。