解决Requests抓取时中文乱码

最新推荐文章于 2022-07-27 01:14:05 发布

天愚

最新推荐文章于 2022-07-27 01:14:05 发布

阅读量1.7k

点赞数 1

分类专栏： requests爬虫学习笔记

requests爬虫学习笔记专栏收录该内容

7 篇文章 0 订阅

订阅专栏

使用requests抓取网页的时候，有时会出现中文乱码的问题，可以试一下以下的方法解决

import requests
from bs4 import BeautifulSoup

headers={'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}
url=''

html=requests.get(url,headers=headers)
html.encoding='utf-8'  #加这段代码
html = BeautifulSoup(html.text,'lxml')

print(html)