最近开始使用openpyxl将爬虫获取的内容写入excel。今天遇到了一个很蠢的问题。就是append的时候报错:can not convert [‘xxxx’] to excel
其实就是openpyxl里面用append()方法按行写入,写入的数据要求是字符串格式,但是显而易见,报错的部分是个列表。所以加上个str()就解决了。
这里要注意,获取到的列表在这里用的是lxml库中的etree解析的:
response = requests.get(url,headers = headers)
if response.status_code == 200:
html = response.text
tree = etree.HTML(html) #解析语句
因跟要获取的元素标签一样的很多,所以用xpath定位元素:
代码:
p_list = tree.xpath("//dl[@class='wrap-info']/dd/p[4]")
for p in p_list:
address = p.xpath("./em/text()") #xpath获取标签下的文本
这里address返回的是一个列表类型的数据!!!所以导致写入excel的时候出错了