python爬虫封装函数_Python爬虫:将headers请求头字符串转为字典的方法

原生请求头字符串

raw_headers = """Host: open.tool.hexun.com

Pragma: no-cache

Cache-Control: no-cache

User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36

Accept: */*

Referer: http://stock.hexun.com/gsxw/

Accept-Encoding: gzip, deflate

Accept-Language: zh-CN,zh;q=0.9,en;q=0.8"""

将字符串转为字典

split(sep=None, maxsplit=None)

headers = dict([line.split(": ",1) for line in raw_headers.split("\n")])

输出测试

print(headers)

"""

{

'Accept-Language': ' zh-CN,zh;q=0.9,en;q=0.8',

'Accept-Encoding': ' gzip, deflate',

'Accept': ' */*',

'User-Agent': ' Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',

'Host': ' open.tool.hexun.com',

'Referer': ' http://stock.hexun.com/gsxw/',

'Pragma': ' no-cache',

'Cache-Control': ' no-cache'

}

"""

封装为函数

def get_headers(header_raw):

"""

通过原生请求头获取请求头字典

:param header_raw: {str} 浏览器请求头

:return: {dict} headers

"""

return dict(line.split(": ", 1) for line in header_raw.split("\n"))

def get_cookies(cookie_raw):

"""

通过原生cookie获取cookie字段

:param cookie_raw: {str} 浏览器原始cookie

:return: {dict} cookies

"""

return dict(line.split("=", 1) for line in cookie_raw.split("; "))

以上这篇Python爬虫:将headers请求头字符串转为字典的方法就是小编分享给大家的全部内容了,希望能给大家一个参考,也希望大家多多支持脚本之家。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值