2021-10-19
解析html字符串,使用etree.HTML(htmlstr)进行解析
解析html文件,使用etree.parse(filepath,parser=etree.HTMLParser(encoding=“utf-8”))
print(resp.text)#返回的是经过解码后的字符串,是str(unicode)类型,有时候会出现解码为乱码的情况,这时就需要自己指定解码方式
print(resp.content)#返回的是一个原生的字符串,就是从网页上抓取的没有经过处理的字符串,是bytes类型
...
原创
2021-10-19 13:48:03 ·
80 阅读 ·
0 评论