背景
最近进行了各城市天气数据的爬取,但是数据爬取下来以后,发现如下问题:
1)每个城市是一个单独的CSV文件
2)文件里没有城市的名称(爬取网站url,使用数字来区分不同城市,因而代码中无法拼接城市名)
3)个别CSV文件出现乱码
数据处理
为了解决以上问题,我在网上查了不少资料,最后发现pandas + excel vba 结合的方式进行处理,效率最快。
1)每个城市是一个单独的CSV文件
解决办法:采用Excel VBA 进行不同工作簿之间的合并。最质朴的,也是最好用的。话不多说,上代码。
// An highlighted block
Sub 合并当前目录下所有工作簿的全部工作表()
Dim MyPath, MyName, AWbName
Dim Wb As Workbook, WbN As String
Dim G As Long
Dim Num As Long
Dim BOX As String
Application.ScreenUpdating = False
MyPath = ActiveWorkbook.Path
MyName = Dir(MyPath & "\" & "*.csv")
AWbName = ActiveWorkbook.Name
Num = 0
Do While MyName <> ""
If MyName <> AWbName Then
Set Wb = Workbooks.Open(MyPath & "\" & MyName)
Num =