爬虫header头中cookies出现双引号如何处理

爬虫header头中cookies出现双引号如何处理

在爬虫中,针对存在反爬机制的网站需要使用cookies
但是网页中的cookies出现了许多双引号影响头

解决办法如下

import requests
import re
from bs4 import BeautifulSoup

url = 'https://www.zhihu.com/billboard'
string = '你的cookies'
string = string.replace('\"',"")
# print(string)

headers = {
    'Host':'www.zhihu.com',
    'Cookie':string,
    'User-Agent':'Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/84.0.4147.105 Safari/537.36'
}
r = requests.get('http://www.zhihu.com',headers=headers)
# print(r.text)

成功解决

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论
爬虫在访问网站时,需要发送HTTP请求头部信息。其中,User-Agent和Cookie是常见的伪装方式。 在豆瓣网站上,如果爬虫的请求头部信息过于简单,那么服务器会返回403禁止访问的错误。因此,我们需要在请求头部信息中添加一些信息来模拟浏览器的行为,从而避免被识别为爬虫。 首先,我们需要设置User-Agent信息,可以使用一些常见的浏览器的User-Agent信息。其次,我们需要添加Cookie信息,可以手动从浏览器中获取一些有效的Cookie值,也可以使用一些第三方库来自动获取。最后,为了增加访问的真实性,我们可以随机生成一些请求头部信息中的字段值。 下面是一个示例代码,展示了如何在爬虫中添加伪装头部和Cookie: ``` import requests import random # 设置伪装的User-Agent user_agent_list = [ "Mozilla/5.0 (Windows NT 10.0; Win64; x64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.3", "Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/50.0.2661.102 Safari/537.36", "Mozilla/5.0 (Windows NT 6.1; WOW64; rv:54.0) Gecko/20100101 Firefox/54.0", "Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_5) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/58.0.3029.110 Safari/537.36", ] # 随机选择一个User-Agent user_agent = random.choice(user_agent_list) # 设置Cookie信息 cookie_str = '这里填写你的Cookie' # 构造请求头部信息 headers = { 'User-Agent': user_agent, 'Cookie': cookie_str, 'Referer': 'https://www.douban.com/', 'Accept-Language': 'zh-CN,zh;q=0.8', } # 发送请求 response = requests.get(url, headers=headers) # 打印响应结果 print(response.text) ```

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

YULIU_

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值