同时还需要注意一下编码问题,这里的CSV文件需要用gbk编码。
下面是从统计局下载下来的CSV数据。
我偷了个懒,直接就先在表格里删除了前三行,如下。
接下来便是用Python对数据进行规整,代码如下。
import pandas as pd
# 读取数据
df = pd.read_csv( gdp.csv , encoding= utf-8 )
(names, values, dates) = ([], [], [])
# 记得去除地区这个列名,遍历年份
for i in df.columns[1:]:
for j, k in zip(df[i], df[ 地区 ]):
# 输出地区、GDP值、年份数据
print(k, j, i)
names.append(k)
values.append(int(j))
dates.append(int(i.replace( 年 , )))
# 生