使用requests抓取网页的时候,有时会出现中文乱码的问题,可以试一下以下的方法解决
import requests
from bs4 import BeautifulSoup
headers={'User-Agent':"Mozilla/5.0 (Windows NT 6.1; WOW64) AppleWebKit/537.1 (KHTML, like Gecko) Chrome/22.0.1207.1 Safari/537.1"}
url=''
html=requests.get(url,headers=headers)
html.encoding='utf-8' #加这段代码
html = BeautifulSoup(html.text,'lxml')
print(html)