Scarpy2.5从入门到高级系列教程(一):快速了解Scrapy框架

Scrapy 快速一览

Scrapy 是一个用于抓取网站和提取结构化数据的应用程序框架,可用于各种有用的应用程序,如数据挖掘、信息处理或历史存档。

尽管 Scrapy 最初是为网页元素抓取而设计的,但是它也能通过使用Apis来提取数据,比如亚马逊的服务接口,或者就一个通用的目的,网页元素抓取。

一个蜘蛛的例子

为了向您展示 Scrapy 带来了什么,我们将向您展示一个 Scrapy Spider 示例,使用最简单的方式运行蜘蛛。

下面是一个爬虫的代码,它从网站 http://quotes.toscrape.com 爬取名言,遵循分页:

# 导入scrapy库
import scrapy


# 创建一个蜘蛛类
# 这在以后,会在创建爬虫项目后,自动生成
# 该类默认继承scrapy中的Spider类
class QuotesSpider(scrapy.Spider):
    # 定义蜘蛛名,这个在后期,你使用命令行创建的时候,
    # 和你使用命令行中的名称保持一致,当然你也可以选择不一致
    name = 'quotes'
    # 定义爬取的url,它是一个列表
    start_urls = [
        'http://quotes.toscrape.com/tag/humor/',
    ]
	# 回调函数,对继承类的重写
    # 这个response相应,是你请求的url的响应结果</
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

大器晚成你别不信

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值