scrapy获取目标cookie

最新推荐文章于 2024-04-11 11:30:41 发布

VIP文章我是菜鸟小白

最新推荐文章于 2024-04-11 11:30:41 发布

阅读量1.9k

点赞数

分类专栏： python scrapy 爬虫文章标签： pyhton scrapy 爬虫

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39497553/article/details/90579885

版权

python2.7代码实现：
爬虫主文件：

# -*- coding: utf-8 -*-
import sys
from scrapy.http import Request

#python语言转码，非必要
reload(sys)
sys.setdefaultencoding("utf-8")

import scrapy

#定义爬虫类，必须继承scrapy.Spider
class DmozSpider(scrapy.Spider):
    name = "itcast"	#设置爬虫名称
    header = {'User-Agent': 'Mozilla/5.0 (Windows NT 10.0; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/65.0.3325.181 Safari/537.36'}	#设置浏览器用户代理
    
    #用start_requests()方法,代替start_urls
    def start_requests(self):
        return [Request('https://www.baidu.com',meta={'cookiejar':1},callback=self.parse)]
    
    #parse回调函数
    def parse(self, response):
        Cookie = response.headers.getlist('Cookie')	#获取响应cookie
        print 1111111111111111111111
        print Cookie
        print 1111111111111111111111
        return 0

我是菜鸟小白

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
scrapy获取目标cookie

python2.7代码实现：爬虫主文件：# -*- coding: utf-8 -*-import sysfrom scrapy.http import Request#python语言转码，非必要reload(sys)sys.setdefaultencoding("utf-8")import scrapy#定义爬虫类，必须继承scrapy.Spiderclass Dmo...
复制链接

扫一扫

专栏目录

我是菜鸟小白 CSDN认证博客专家 CSDN认证企业博客

码龄7年

7: 原创

61万+: 周排名

106万+: 总排名

1万+: 访问

: 等级

219: 积分

2: 粉丝

3: 获赞

5: 评论

13: 收藏

私信

关注

分类专栏

javascript 3篇
linux 2篇
python 3篇
scrapy 3篇
爬虫 3篇

最新评论

关于linux远程断开，后台进程关闭问题
「已注销」回复我是菜鸟小白: 对的其实用 xx & 再exit也是能后台的比较方便的方法还又tmux/screen或哲setsid xxx 直接将该命令的进程将给1号即可。
关于linux远程断开，后台进程关闭问题
我是菜鸟小白回复「已注销」: 对，但是我遇到的问题是，一断开连接，session进程就跟着断了，然后进程也就断了，就用文中的方法解决了
关于linux远程断开，后台进程关闭问题
「已注销」: nohup作用不就是忽略sighup信号么
setTimeout定时器的异步及let循环中的同步异步问题个人理解笔记
我是菜鸟小白回复这问题又不会: 这就发这就发
setTimeout定时器的异步及let循环中的同步异步问题个人理解笔记
这问题又不会: 大佬，接着更博客啊

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。