使用requests库发起gbk编码的get请求

最新推荐文章于 2024-09-04 08:00:00 发布

dejing6575

最新推荐文章于 2024-09-04 08:00:00 发布

阅读量2.2k

点赞数 1

文章标签： python 爬虫

原文链接：http://www.cnblogs.com/weiyinfu/p/8088085.html

版权

有一个爬虫，查询需要发起get请求，这个网站整个都是gbk编码
如果直接发起请求，是不可以的，因为请求参数q首先用utf8编码转化成bytes，然后将bytes进行URLEncode变为字符串。

resp=requests.get("http://haha.com",params={
    "q":"你好"
})
print(resp.url)

第一种解决方法：直接使用bytes，而不用字符串，则可以避免将字符串用utf8编码

res = requests.get("http://www.baidu.com", params={
    'q': bytes('天下大势为我所控', 'gbk')
})

第二种解决方法，直接拼串

url="http://www.baidu.com/"+requests.utils.quote("天下大势为我所控",encoding='gbk')
requests.get(url)

第三种解决方法，使用PreparedRequest

from requests.models import PreparedRequest 
p=PreparedRequest()
s=p.prepare_url("http://www.baidu.com",params={
    'q':bytes('天下大势为我所控','gbk')
})
print(p.url)

作为一个纯python的库，requests还是很值得研究的。

转载于:https://www.cnblogs.com/weiyinfu/p/8088085.html

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

dejing6575

关注关注

1
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

Python爬虫：requests模块的基本使用

Hello大家好，我是Dream，如果帮得到你，那我深感荣幸！交流学习、商务合作：https://bbs.csdn.net/topics/614347534

07-17

6万+

在url地址中，很多参数是没有用的，比如百度搜索的url地址，其中参数只有一个字段有用，其他的都可以删除。对应的,在后续的爬虫中，越到很多参数的url地址，都可以尝试删除参数。需求：通过requests向百度首页发送请求，获取百度首页的数据。以上三种方法从前往后尝试，能够100%的解决所有网页解码的问题。我们在使用百度搜索的时候经常发现url地址中会有一个。模拟浏览器，欺骗服务器，获取和浏览器一致的内容。我们先写一个获取百度首页的代码。的方式获取响应的html页面。，那么该问号后边的就是。

Python从0到100（二十七）：requests模块的基本使用

Hello大家好，我是Dream，如果帮得到你，那我深感荣幸！交流学习、商务合作：https://bbs.csdn.net/topics/614347534

05-27

6万+

参与评论您还未登录，请先登录后发表或查看评论

python中requests模块中get请求的使用

ljf520lhy的博客

11-17

2332

requests模块中的get请求

JavaHttpGet中文内容编码为GBK时注意

ASC2046边角料

08-24

1526

背景：调用第三方接口，接口数据为GBK编码在 new BufferedReader(new InputStreamReader( connection.getInputStream(),"GBK")); 这个时候处理GBK编码

3种Python爬虫中文乱码的处理方法

Python_00001的博客

08-08

1173

Python爬虫在抓取网页数据时，经常会遇到中文乱码问题。这通常是因为网页的编码格式与Python处理时使用的编码格式不一致导致的。以下是三种常见的处理中文乱码的方法，并附上相应的代码示例。

python中gbk_python获取gbk中文字符 | 学步园

weixin_39630744的博客

12-09

491

# -*- coding: gbk -*-def getGBK(s):i = 0first = (int('81',16),int('FE',16))second1 = (int('40',16),int('7E',16))second2= (int('80',16),int('FE',16))buf = []while True:ch1 = ord(s[i])if ch1 >= first...

python中 requests.get()乱码问题

m0_58370843的博客

04-05

289

将project encoding上设置成系统默认的GBK 点击 ok。发现我本来的就是 utf-8 的格式。解决方法：（//后面没有用上）

python request.get乱码_python requests乱码解决方案（转）

weixin_29798981的博客

12-24

1412

python requests乱码解决方案(转)版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。本文链接：https://blog.csdn.net/getcomputerstyle/article/details/71194418在使用requests获取网页源代码之后：from bs4 importBeautifulSoupimportr...

最全请求库requests的使用方法

weixin_43934369的博客

04-12

1214

请求库requests的使用方法一.基本使用 1.简介 requests库是一个著名的请求库，它把python标准库urllib3封装起来，使api的使用更加的方便和简洁。 2.安装 pip install requests pip默认使用的是官方的源来安装，如果速度很慢，建议换一个源安装。 3.使用requests发起一个请求我们先导入requests，然后发送一个请求，使用response...

【Python爬虫】爬虫利器 requests 库小结

你豪哥的博客

08-06

2289

Requests 是一个 Python 的 HTTP 客户端库。支持许多 HTTP 特性，可以非常方便地进行网页请求、网页分析和处理网页资源，拥有许多强大的功能。本文主要介绍Python的requests库的使用方法。

【Python爬虫系列】_010.requests库详解(重点)

最新发布

weixin_50296259的博客

09-04

1516

常用方法requests.get() # 发送get请求# 请求参数可以直接放在url的?后面，也可以放在字典里，传递给params参数requests.post() # 发送post请求# 请求参数要放在字典中，然后传递给data参数requests有两个响应对象response响应对象包含：响应行、响应头、空行、响应体(通过content、text、json获取)

Python爬虫：requests库改变编码

01-12

2595

import requests url = 'https://www.csdn.net/'#原编码为utf-8 response = requests.get(url) response.encoding = 'gbk' print(response.encoding) 结果 gbk

python3 requests爬取gbk时候遇到编码的坑

weixin_30378311的博客

08-31

2555

python3默认是utf8的，爬取gbk网页的时候会出现乱码解决办法 test.encoding="gbk" test.text text不转换会出现错误，python3字符集不支持转码第二种方法 test.content.decode("gbk") decode的作用是将其他编码的字符串转换成unicode编码，如str1.decode('gb2312'...

python解码gbk_解决Python3 requests 响应头中文GBK编码报错，无法请求

weixin_39819138的博客

11-23

1015

问题表现：响应头中有gbk编码的中文，导致requests无法解码读取header。http包如图：Python 3.4.3 (default, Aug 25 2017, 16:49:50)[GCC 4.8.5 20150623 (Red Hat 4.8.5-11)] on linuxType "help", "copyright", "credits" or "license" for more...

get方式传值中文乱码

刚刚

08-28

3万+

如下情况： <a id="bookname" title="${book.bname }" href="<c:url value='/BookServlet?method=findByBname&bname=${book.bname }'/>"> 点击超链接，则传值到servlet中，在servelt中通过request.getParameter("bname"); 获取到的中文字符都显示

解决Requests中文乱码