知识学了就有用,虽然现在用不上,哈哈
今天学习了用标准库中的分析文本的编码,可以探测网页源代码的编码
下面展示一些 内联代码片
。
// 使用chardet库中的detect方法来探测
// An highlighted block
from chardet import detect
a = detect(res.content) #爬虫网页请求回来的数据,以byte形式
print(a) #打印出结果,是个字典形式
print(a['encoding']) #输出返回数据的编码