python requests结果乱码问题

最新推荐文章于 2024-09-08 21:29:01 发布

qq_40982824

最新推荐文章于 2024-09-08 21:29:01 发布

阅读量481

点赞数

文章标签： python 乱码

原文链接：https://blog.csdn.net/jun118166/article/details/106994103

版权

import requests
 爬取阳光电影
html = requests.get("https://www.ygdy8.com/index.html")
print(html.text)

运行发现，打印乱码.

<a href='/html/gndy/jddy/20160320/50541.html'>IMDBÆÀ·Ö8·Ö×óÓÒÓ°Æ¬400Óà²¿</a><br/>
<a href='/html/gndy/jddy/20200627/60172.html'>2020ÄêÏ²¾ç¡¶Ôã¸â×ÉÑ¯/²»Á¼ÂÉ</a><br/>
<a href='/html/gndy/dyzz/20200627/60171.html'>2019Äê»ñ½±¾çÇéÒôÀÖ¡¶ÃÛ·äÓë</a><br/>
<a href='/html/gndy/dyzz/20200627/60170.html'>2019Äê¶¯×÷ÔÖÄÑ¡¶¼«ÏÞÌÓÉú¡·B</a><br/>
<a href='/html/gndy/jddy/20200627/60169.html'>2008Äê¸ß·ÖÐüÒÉ¡¶ÏÓÒÉÈËXµÄÏ×</a><br/>
<a href='/html/gndy/jddy/20200627/60168.html'>2020Äê¿Æ»ÃÐüÒÉ¡¶»úÐµ»Æ¤¡·H</a><br/>
<a href='/html/gndy/jddy/20200627/60167.html'>2020Äê¿Æ»ÃÐüÒÉ¡¶»úÐµ»Æ¤¡·H</a><br/>
<a href='/html/gndy/jddy/20200627/60166.html'>2020ÄêÆæ»Ã¡¶ÏÉÊéÆæÌ·/×½ÏÉ¼Ç</a><br/>
<a href='/html/gndy/jddy/20200626/60164.html'>2020Äê¾çÇé·¸×ï¡¶¶ñÃû/ÄÏ·½Ö®</a><br/>

首先我们需要查看网站是什么编码，这个时候用会用到charset我们发现charset=gb2312.
在这里插入图片描述
这个时候我们只需要添加一行html.encoding = "gb2312"即可

import requests

# 爬取阳光电影
html = requests.get("https://www.ygdy8.com/index.html")
html.encoding = "gb2312"
print(html.text)

qq_40982824

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫