解析html字符串,使用etree.HTML(htmlstr)进行解析
解析html文件,使用etree.parse(filepath,parser=etree.HTMLParser(encoding=“utf-8”))
print(resp.text)#返回的是经过解码后的字符串,是str(unicode)类型,有时候会出现解码为乱码的情况,这时就需要自己指定解码方式
print(resp.content)#返回的是一个原生的字符串,就是从网页上抓取的没有经过处理的字符串,是bytes类型
2021-10-19
最新推荐文章于 2023-04-30 10:49:36 发布