Scrapy框架--Request和FormRequest

最新推荐文章于 2025-03-03 10:07:25 发布

我还可以熬_

最新推荐文章于 2025-03-03 10:07:25 发布

阅读量1.2k

点赞数 3

文章标签： scrapy python

本文链接：https://blog.csdn.net/m0_67093160/article/details/131442683

版权

Request对象表示HTTP请求，包括URL、回调函数、HTTP方法等参数。FormRequest是带有表单数据的Request，常用于模拟表单提交。响应对象Response包含HTTP状态、头部和响应体，通常由下载器返回给爬虫处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

Request对象

爬虫中请求与响应是最常见的操作，Request对象在爬虫程序中生成并传递到下载器中，后者执行请求并返回一个Response对象。

class scrapy.http.Request(url[, callback, method='GET', headers, body, cookies, meta, encoding='utf-8', priority=0, dont_filter=False, errback])

一个Request对象表示一个HTTP请求，它通常是在爬虫生成，并由下载执行，从而生成Response。

url（string） - 此请求的网址
callback（callable） - 将使用此请求的响应（一旦下载）作为其第一个参数调用的函数。有关更多信息，请参阅下面的将附加数据传递给回调函数。如果请求没有指定回调，parse()将使用spider的方法。请注意，如果在处理期间引发异常，则会调用errback。
method（string） - 此请求的HTTP方法。默认为'GET'。可设置为"GET", "POST", "PUT"等，且保证字符串大写
meta（dict） - 属性的初始值Request.meta,在不同的请求之间传递数据使用
body（str或unicode） - 请求体。如果unicode传递了，那么它被编码为 str使用传递的编码（默认为utf-8）。如果 body没有给出，则存储一个空字符串。不管这个参数的类型，存储的最终值将是一个str（不会是unicode或None）。
headers（dict） - 这个请求的头。dict值可以是字符串（对于单值标头）或列表（对于多值标头）。如果 None作为值传递，则不会发送HTTP头.一般不需要
encoding: 使用默认的 'utf-8' 就行
dont_filter：是否过滤重复的URL地址，默认为 False过滤
cookie（dict或list） - 请求cookie。这些可以以两种形式发送。
- 使用dict：