关于python，使用xpath 中 etress.HTML()中文乱码问题

最新推荐文章于 2023-10-13 18:49:18 发布

大叔学python

最新推荐文章于 2023-10-13 18:49:18 发布

阅读量3.9k

点赞数 4

文章标签： xpath etree.html 中文乱码

本文链接：https://blog.csdn.net/qq_40677222/article/details/84109076

版权

第一次使用xpath，爬取猫眼电源，无中文显示了，
import requests
from lxml import etree
url = “http://maoyan.com/board/4”
headers = {
“User-Agent”: “Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML, like Gecko) Chrome/70.0.3538.77 Safari/537.36”
}
r = requests.get(url, headers=headers).text
html = etree.HTML®
result = etree.tostring(html")
print(result.decode(“utf-8”))

查了很多资料，试了很多办法，都不能正常显示中文，
思来想去，不知道哪里来了一句
etree.tostring(strs, encoding=“utf-8”, pretty_print=True, method=“html”)
加入代码中。
result = etree.tostring(strs, encoding=“utf-8”, pretty_print=True, method=“html”)
print(result.decode(“utf-8”))
正常输出，中文
试了下，去掉后两个参数也能显示中文，大家自行思考吧！

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

大叔学python

关注关注

4
点赞
踩
8

收藏

觉得还不错? 一键收藏
6
评论
关于python，使用xpath 中 etress.HTML()中文乱码问题

第一次使用xpath，爬取猫眼电源，无中文显示了，import requestsfrom lxml import etreeurl = “http://maoyan.com/board/4”headers = {“User-Agent”: “Mozilla/5.0 (Macintosh; Intel Mac OS X 10_12_6) AppleWebKit/537.36 (KHTML,...
复制链接

扫一扫