python爬虫封装函数_Python爬虫:将headers请求头字符串转为字典的方法

最新推荐文章于 2022-11-29 14:03:15 发布

weixin_39632291

最新推荐文章于 2022-11-29 14:03:15 发布

阅读量343

点赞数

文章标签： python爬虫封装函数

原生请求头字符串

raw_headers = """Host: open.tool.hexun.com

Pragma: no-cache

Cache-Control: no-cache

User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36

Accept: */*

Referer: http://stock.hexun.com/gsxw/

Accept-Encoding: gzip, deflate

Accept-Language: zh-CN,zh;q=0.9,en;q=0.8"""

将字符串转为字典

split(sep=None, maxsplit=None)

headers = dict([line.split(": ",1) for line in raw_headers.split("\n")])

输出测试

print(headers)

"""

{

'Accept-Language': ' zh-CN,zh;q=0.9,en;q=0.8',

'Accept-Encoding': ' gzip, deflate',

'Accept': ' */*',

'User-Agent': ' Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/63.0.3239.84 Safari/537.36',

'Host': ' open.tool.hexun.com',

'Referer': ' http://stock.hexun.com/gsxw/',

'Pragma': ' no-cache',

'Cache-Control': ' no-cache'

}

"""

封装为函数

def get_headers(header_raw):

"""

通过原生请求头获取请求头字典

:param header_raw: {str} 浏览器请求头

:return: {dict} headers

"""

return dict(line.split(": ", 1) for line in header_raw.split("\n"))

def get_cookies(cookie_raw):

"""

通过原生cookie获取cookie字段

:param cookie_raw: {str} 浏览器原始cookie

:return: {dict} cookies

"""

return dict(line.split("=", 1) for line in cookie_raw.split("; "))

以上这篇Python爬虫:将headers请求头字符串转为字典的方法就是小编分享给大家的全部内容了，希望能给大家一个参考，也希望大家多多支持脚本之家。

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

weixin_39632291

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫：requests模块的基本使用

Hello大家好，我是Dream，如果帮得到你，那我深感荣幸！交流学习、商务合作：https://bbs.csdn.net/topics/614347534

07-17

7万+

在url地址中，很多参数是没有用的，比如百度搜索的url地址，其中参数只有一个字段有用，其他的都可以删除。对应的,在后续的爬虫中，越到很多参数的url地址，都可以尝试删除参数。需求：通过requests向百度首页发送请求，获取百度首页的数据。以上三种方法从前往后尝试，能够100%的解决所有网页解码的问题。我们在使用百度搜索的时候经常发现url地址中会有一个。模拟浏览器，欺骗服务器，获取和浏览器一致的内容。我们先写一个获取百度首页的代码。的方式获取响应的html页面。，那么该问号后边的就是。

python 请求头_Python爬虫：将headers请求头字符串转为字典

weixin_39737233的博客

01-28

349

第一种方法如上图所示，然后复制粘贴到pycharm里，存放到字典里然后使用ctrl+r快捷键打开替换功能，并勾选Regex替换源为：(.?): (.?)$替换为："$1": “$2”, 然后点击Replace all替换全部：最后再ctrl+alt+L键，整理一下格式就行了第二种方法原生请求头字符串raw_headers = """Host: open.tool.hexun.comPrag...

参与评论您还未登录，请先登录后发表或查看评论

python爬虫封装函数_Python3爬虫（面向对象）

weixin_39604516的博客

11-30

307

Python3爬虫(面向对象)

Python写入字典_python的封包与解包

weixin_39877805的博客

11-21

311

1. python 封包将多个值赋值给一个变量时，python会自动将这些值封装成元组，这个特性称之为封包a 当函数返回多个数值时，也会进行封包def 实践中，很少主动使用封包操作2. python解包python解包是使用频率非常高的技术，下面列列举几种使用python解包的场景2.1 接收函数返回值def 函数的返回值是一个元组，左侧是三个变量，这样就会发生解包，a, b, c依次等于元组里的...

headers 字符串代码转换为字典

qq_47729488的博客

08-31

334

实现过程： s4 = '''hdajg:gfafgag hfajhfajfwfgahfahfafga:hafhsg fjakfhwifafwufajskfwhhfajf:faffaf hfafhesffu:fahfhfaa hfwufaljwfaljhf:fgafgaha hfajfwihsfahafahfhfa:hfaffgafj jfahfefhfehfhhfafia:affgafajfj''' list = filter(lambda x:len(x.strip())>0,s4.split('\

如何将爬虫获得的数据变为字典的key_Python爬虫第二战爬取500px图片

weixin_39539807的博客

12-06

747

前言：如今的高速网络极大促进了信息的展示方式，高清图片，视频等成就了我们的视听盛宴。但是，我们获取到的图片或者视频可能是被压缩过的，所以总体上还是有点小瑕疵，今天呢，我给大家带来一篇使用Python爬取著名高清图片网站500px图片的文章，这个爬虫具有搜索功能哦。让你感受摄影魅力！通过这篇文章的学习，你将学会：使用requests库发起请求将requests请求结果转化为json类型提取json类...

第二天，封装headers

最新发布

dugumona的博客

11-29

358

第二天，封装headers

Python爬虫:将headers请求头字符串转为字典的方法

01-01

原生请求头字符串 raw_headers = Host: open.tool.hexun.com Pragma: no-cache Cache-Control: no-cache User-Agent: Mozilla/5.0 (Macintosh; Intel Mac OS X 10_13_2) AppleWebKit/537.36 (KHTML, like Gecko) ...

python爬虫请求头是什么意思_python爬虫请求头的使用

weixin_36099614的博客

01-14

1860

这篇文章我们来讲一下在网站建设中，python爬虫请求头的使用。本文对大家进行网站开发设计工作或者学习都有一定帮助，下面让我们进入正文。爬虫请求头网页获取：通过urlopen来进行获取requset.urlopen(url,data,timeout)第一个参数url即为URL，第二个参数data是访问URL时要传送的数据，第三个timeout是设置超时时间。第二三个参数是可以不传送的，data默认...

python爬虫实现POST request payload形式的请求

12-20

`json.dumps()`函数用于将Python字典转换为JSON字符串，以便在HTTP请求中使用。 ### 3. 面对不同的Payload类型 - **JSON**：适用于传输结构化的数据，如服务器API交互。 - **multipart/form-data**：常用于上传...

爬虫 请求头header组成以及说明

weixin_45070922的博客

03-02

915

python对于requests的封装方法详解

09-19

今天小编就为大家分享一篇python对于requests的封装方法详解，具有很好的参考价值，希望对大家有所帮助。一起跟随小编过来看看吧

Python接口自动化框架之Requests、Headers、Token封装

hyx_try的博客

10-22

1102

登录接口获取token

爬虫（四）-爬虫伪装模拟浏览器向浏览器要数据，requests.get()里的参数之params，headers

weixin_45239949的博客

08-13

2395

爬取周杰伦评论寻找XHR方法 requests.get()里的参数之params，可以让我们用字典的形式，把参数传进去 Query String Parametres，它的中文翻译是：查询字符串参数，将其封装成字典，注意复制过来后要加上引号和逗号。 requests.get()里的参数之headers，可以伪装成浏览器。每一个请求，都会有一个Requests Headers，我们把它称作请求...

python flaskfeng封装跨域请求头和封装json格式

weixin_34049948的博客

10-03

263

为什么80%的码农都做不了架构师？>>> ...

python爬虫入门（#4）——get方法详解之params参数