1、lxml模块,使用xpath时,出现了以下错误:
刚开始一脸懵逼,不知道咋办,仔细一想错误提示:
ValueError:can only parse strings
不能解析字符串,终于知道了,原来我前面请求得到的req里面不仅仅是字符串,还有许多html标签。
我将这一位置代码的req
替换为 req.text
,只取文本内容
就成功解析。
2、python爬虫爬取的中文数据存为.csv和.xlsx时出现乱码,解决办法
python爬虫爬取的数据存为.csv和.xlsx时出现乱码,但是用记事本打开后,又会正常显示。
解决办法;
用记事本打开,然后另存为.csv或.xlsx格式,编码格式要选为‘utf-8’,再打开文件就会正常显示。