上一篇文章中,我们开发了一套一键自动化采集大众点评评论信息的脚本。采集的评论信息以Excel格式存储在一个文件夹下。
为了方便以后对Excel文件的管理,还有对于采集到的数据的规整,比如说,现在采集到的数据每一页评论数据保存在一个新的Excel中,每页数据有15条,看起来很不方便,正常的需求就是将所有的数据放在一张Excel表格中。
那么,我们这篇要讲解的脚本就必须有两个功能:
1. 可以将多个Excel文件合并的脚本;
2. 可以一键删除所有Excel表格的脚本。(删除文件,也是懒得不想动的)
一、合并多个Excel表格
合并Excel表格思路一种是:读取第一个Excel表格的内容,追加到第二个Excel表格,然后读取第二个Excel表格的数据,存入第三个Excel表格……以此类推。
这个思路的流程是对的,不过太Low了,也就是简单实现了功能,而且对同一个Excel表格读取了两次,耗时最多,效率最慢。
第二种思路是:从第二个Excel表格开始,读取Excel表格内容,追加到第一个Excel表格中。我们获取到文件夹下所有的文件路径,然后切片获取从第二个Excel表格文件开始的文件列表。每个Excel表格只读取一次(除了第一个Excel表格保持打开状态)。同时保持数据顺序正确,也没有多余操作。效率跟功能基本算是优解了。
So,就确定是第二种思路了。
(其实,我自己写好的脚本思路是,先创建一个新的Excel表格,然后逐一读取所有Excel表格,追加到新的Excel表格中。这