1 if req.encoding == 'ISO-8859-1': 2 tree = etree.HTML(req.content) 3 else: 4 tree = etree.HTML(req.text)
然后再直接写入例如:
1 connect.escape(tree.xpath("//title/text()")[0])
用的requests,可以自动识别编码,但是有时候还是不行。
else指无论gbk还是gb2312还是utf-8,requests可以正确识别这些。
1 if req.encoding == 'ISO-8859-1': 2 tree = etree.HTML(req.content) 3 else: 4 tree = etree.HTML(req.text)
然后再直接写入例如:
1 connect.escape(tree.xpath("//title/text()")[0])
用的requests,可以自动识别编码,但是有时候还是不行。
else指无论gbk还是gb2312还是utf-8,requests可以正确识别这些。
转载于:https://www.cnblogs.com/shadowhu/p/7843269.html