Scrapy框架学习笔记(一)

最新推荐文章于 2024-05-30 21:09:53 发布

德老哥

最新推荐文章于 2024-05-30 21:09:53 发布

阅读量400

点赞数

分类专栏： Scrappy 文章标签：框架

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/delaoge/article/details/50082993

版权

Scrappy 专栏收录该内容

2 篇文章 0 订阅

订阅专栏

Scrapy框架学习笔记(一)

关于 Spider

概念

用于从Scrapy(内部)传递过来的Response对象中,提取数据,并装进Items对象里,然后返回给Scrapy处理

怎么用

创建Spider文件

项目/Spiders/

添加Spider类,如:文件名,类名,其属性name的最好一致

在文件里写到

import scrape
class 类名(spider):
    name = 类名
    # ...
    # ...

scrapy 如何启动你写好的spider类

在命令行里,你的根目录下输入:scrapy crawl 类名

定制spider的行为

– (默认),提前写好你要分析的url,和通用的parse方法,来决定你要怎么分析URL里Response的内容

– 自定义的,写好你要分析的URL,及其对应的URL的回调函数(非parse),来不同地分析对应URL的response的内容

如何分析Response里的内容

– 单纯的填充Item对象,并返回给Spider

– 深度的分析,Response里的其他url,然后在进一步的设计其回调函数

其他: 让你的Spider,可以接收从命令行而来的参数
其他:如何从Response的内容里,遍历快捷的获取数据

使用selector选择器

使用Scrapy内置的多种spider,来实现更多的功能
自定义自己的Spider,实现更多你想要的内容

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。