SCRAPY_part7_杂记

最新推荐文章于 2022-04-19 18:53:41 发布

摇就完事了

最新推荐文章于 2022-04-19 18:53:41 发布

阅读量148

点赞数

分类专栏： SCRAPY笔记

本文链接：https://blog.csdn.net/weixin_38244232/article/details/78969856

版权

SCRAPY笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

TIPS

Cookie
一般情况下在 Settings 里激活COOKIES_ENABLED = True能够调用浏览器的Cookie。
如果需要特定的Cookie、可以像这样使用、还可以设置参数不与浏览器传回来的COOKIE融合

def start_requests(self):
   yield Request(url='http://www.auchandrive.fr/drive/St-Quentin-985/', cookies={'auchanCook': '"985|"'})

CookiesMiddleware
可在 Downloader Middleware 中激活
模拟账号登陆常用套路–使用 FormRequest 类
继承自 Request

 return scrapy.FormRequest.from_response(
    response,
    #用 formdata 传递数据 POST填充的数据
    formdata={'username': 'john', 'password': 'secret'},
    callback=self.after_login
    )
# from_response()会自动识别 <input type="hidden"> 元素,但是如果是用 javascript 填充的表单的话可能会引发冲突

Downloader Middleware（下载中间件）
下载中间件主要是定义请求在发送到下载器之前添加一些额外信息的中间件 , 比如添加随机IP 或者 U-R, 用于反爬。一定要定义 process_request(request, spider)。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

摇就完事了

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
SCRAPY_part7_杂记

TIPSCookie 一般情况下在 Settings 里激活COOKIES_ENABLED = True能够调用浏览器的Cookie。如果需要特定的Cookie、可以像这样使用、还可以设置参数不与浏览器传回来的COOKIE融合def start_requests(self): yield Request(url='http://www.auchandrive.fr/d
复制链接

扫一扫