我们在进行网页的获取时,通常要查看该网页的编码时,可以通过python去获取该网页的编码格式。
from urllib import request
import chardet
if __name__ == "__main__":
response = request.urlopen("https://wenku.baidu.com/view/2d2f8384a0116c175f0e48fb.html")
html = response.read()
charset = chardet.detect(html)#对该html进行编码的获取
print(charset) #打印编码格式