python 解决requests中文乱码

import requests

# 爬取阳光电影
html = requests.get("https://www.ygdy8.com/index.html")

print(html.text)

运行发现,打印乱码

<a href='/html/gndy/jddy/20160320/50541.html'>IMDBÆÀ·Ö8·Ö×óÓÒӰƬ400Óಿ</a><br/>
<a href='/html/gndy/jddy/20200627/60172.html'>2020Äêϲ¾ç¡¶Ôã¸â×Éѯ/²»Á¼ÂÉ</a><br/>
<a href='/html/gndy/dyzz/20200627/60171.html'>2019Äê»ñ½±¾çÇéÒôÀÖ¡¶ÃÛ·äÓë</a><br/>
<a href='/html/gndy/dyzz/20200627/60170.html'>2019Ä궯×÷ÔÖÄÑ¡¶¼«ÏÞÌÓÉú¡·B</a><br/>
<a href='/html/gndy/jddy/20200627/60169.html'>2008Äê¸ß·ÖÐüÒÉ¡¶ÏÓÒÉÈËXµÄÏ×</a><br/>
<a href='/html/gndy/jddy/20200627/60168.html'>2020Äê¿Æ»ÃÐüÒÉ¡¶»úе»­Æ¤¡·H</a><br/>
<a href='/html/gndy/jddy/20200627/60167.html'>2020Äê¿Æ»ÃÐüÒÉ¡¶»úе»­Æ¤¡·H</a><br/>
<a href='/html/gndy/jddy/20200627/60166.html'>2020ÄêÆæ»Ã¡¶ÏÉÊéÆæÌ·/×½ÏɼÇ</a><br/>
<a href='/html/gndy/jddy/20200626/60164.html'>2020Äê¾çÇé·¸×¶ñÃû/ÄÏ·½Ö®</a><br/>

怎么解决呢?网上答案很多,很容易误导有说设置utf-8的;这里我要跟大家讲的是方法,首先我们需要查看网站是什么编码,这个时候用会用到charset我们发现charset=gb2312
在这里插入图片描述
这个时候我们只需要添加一行html.encoding = "gb2312"即可

import requests

# 爬取阳光电影
html = requests.get("https://www.ygdy8.com/index.html")
html.encoding = "gb2312"
print(html.text)
  • 4
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值