python 解决requests中文乱码

最新推荐文章于 2024-05-22 14:55:11 发布

烟雨江南行

最新推荐文章于 2024-05-22 14:55:11 发布

阅读量1.5w

点赞数 4

分类专栏： python 文章标签： python 爬虫

本文链接：https://blog.csdn.net/jun118166/article/details/106994103

版权

python 专栏收录该内容

24 篇文章 1 订阅

订阅专栏

import requests

# 爬取阳光电影
html = requests.get("https://www.ygdy8.com/index.html")

print(html.text)

运行发现，打印乱码

<a href='/html/gndy/jddy/20160320/50541.html'>IMDBÆÀ·Ö8·Ö×óÓÒÓ°Æ¬400Óà²¿</a><br/>
<a href='/html/gndy/jddy/20200627/60172.html'>2020ÄêÏ²¾ç¡¶Ôã¸â×ÉÑ¯/²»Á¼ÂÉ</a><br/>
<a href='/html/gndy/dyzz/20200627/60171.html'>2019Äê»ñ½±¾çÇéÒôÀÖ¡¶ÃÛ·äÓë</a><br/>
<a href='/html/gndy/dyzz/20200627/60170.html'>2019Äê¶¯×÷ÔÖÄÑ¡¶¼«ÏÞÌÓÉú¡·B</a><br/>
<a href='/html/gndy/jddy/20200627/60169.html'>2008Äê¸ß·ÖÐüÒÉ¡¶ÏÓÒÉÈËXµÄÏ×</a><br/>
<a href='/html/gndy/jddy/20200627/60168.html'>2020Äê¿Æ»ÃÐüÒÉ¡¶»úÐµ»Æ¤¡·H</a><br/>
<a href='/html/gndy/jddy/20200627/60167.html'>2020Äê¿Æ»ÃÐüÒÉ¡¶»úÐµ»Æ¤¡·H</a><br/>
<a href='/html/gndy/jddy/20200627/60166.html'>2020ÄêÆæ»Ã¡¶ÏÉÊéÆæÌ·/×½ÏÉ¼Ç</a><br/>
<a href='/html/gndy/jddy/20200626/60164.html'>2020Äê¾çÇé·¸×ï¡¶¶ñÃû/ÄÏ·½Ö®</a><br/>

怎么解决呢？网上答案很多，很容易误导有说设置utf-8的；这里我要跟大家讲的是方法，首先我们需要查看网站是什么编码，这个时候用会用到charset我们发现charset=gb2312
在这里插入图片描述
这个时候我们只需要添加一行html.encoding = "gb2312"即可

import requests

# 爬取阳光电影
html = requests.get("https://www.ygdy8.com/index.html")
html.encoding = "gb2312"
print(html.text)

烟雨江南行

关注

4
点赞
踩
5

收藏

觉得还不错? 一键收藏
1
评论
python 解决requests中文乱码

import requests# 爬取阳光电影html = requests.get("https://www.ygdy8.com/index.html")print(html.text)运行发现，打印乱码<a href='/html/gndy/jddy/20160320/50541.html'>IMDBÆÀ·Ö8·Ö×óÓÒÓ°Æ¬400Óà²¿</a><br/><a href='/html/gndy/jddy/20200627/60172.ht
复制链接

扫一扫