实现html表格与excel表格的相互转化。方法很简单。
近期想把网页上的表格下载保存成excel文件。网上的办法要么表述不清,要么太过繁杂。始终没有找到很好的解决办法。
最后我通过学习pandas模块简单的实现了这一过程。
解决中文乱码的文章:解决python中文编码混乱的问题
实现的代码如下:
import pandas
with open('C:\Users\zhaoyingh\Desktop\\a.txt','r') as f:
df = pandas.read_html(f.read().decode("gb2312").encode('utf-8'),encoding='utf-8')
print df[0]
bb = pandas.ExcelWriter('out.xlsx')
df[0].to_excel(bb)
bb.close()
同样的pandas中含有read_excel和to_html函数实现excel与html之间的转化。