requests获取到的网页源码中存在乱码的三个解决方法

16 篇文章 0 订阅
>>> res = requests.get(html)
>>> print(res.text)
^&&*!!@#5%#

从html的头部可见使用gbk字符集:

<html>
<head>
	...
	<meta http-equiv="Content-Type" content="text/html; charset=gbk">
	...

方法一:

>>> res.encoding = 'gbk'
>>> print(res.text)

方法二:

>>> res.encoding = res.apparent_encoding
>>> print(res.text)

方法三:

>>> print(res.text.encode('iso-8859-1').decode('gbk')

2020-08-06 更新

某网站使用gbk进行编码
最开始我使用方法二

<!DOCTYPE html>\r\n<html>\r\n<head>\r\n    <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\r\n    <link rel="icon" href="/favicon.ico" type="image/x-icon"/>\r\n    <meta http-equiv="Content-Type" content="text/html; charset=gbk">\n    <title>【深圳-龙华新区影像����工程��_影像����工程��招聘_富士康科技集团CMBU】-前程无忧官方招聘网站</title>\n    <meta name="description" content="深圳-龙华新区影像����工程��富士康科技集团CMBU招聘,前程无忧官方网站,提供最新最全富士康科技集团CMBU招聘职位,以及深圳-龙华新区影像����工程��相关职业信息。帮助您顺利获得深圳-龙华新区影像����工程��的职位,前程无忧招聘网站助您开启崭新职业生涯,找工作上前程无忧!">\n    <meta name="keywords" content="深圳-龙华新区影像����工程��招聘,富士康科技集团CMBU招聘,深圳-龙华新区影像����工程��最新招聘信息">\n 

换用方法三后

<!DOCTYPE html>\r\n<html>\r\n<head>\r\n    <meta http-equiv="X-UA-Compatible" content="IE=edge,chrome=1">\r\n    <link rel="icon" href="/favicon.ico" type="image/x-icon"/>\r\n    <meta http-equiv="Content-Type" content="text/html; charset=gbk">\n    <title>【深圳-龙华新区影像數據工程師_影像數據工程師招聘_富士康科技集团CMBU】-前程无忧官方招聘网站</title>\n    <meta name="description" content="深圳-龙华新区影像數據工程師富士康科技集团CMBU招聘,前程无忧官方网站,提供最新最全富士康科技集团CMBU招聘职位,以及深圳-龙华新区影像數據工程師相关职业信息。帮助您顺利获得深圳-龙华新区影像數據工程師的职位,前程无忧招聘网站助您开启崭新职业生涯,找工作上前程无忧!">\n    <meta name="keywords" content="深圳-龙华新区影像數據工程師招聘,富士康科技集团CMBU招聘,深圳-龙华新区影像數據工程師最新招聘信息">\n 
  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值