作者 | 小F
出品 | 法纳斯特
Python数据可视化:25年GDP之变
说实话,这一期起的有点标题党了。
用到的Python知识并不多,只是利用Python对数据进行规整。
最多的应该是用大佬造的轮子,基于D3.js的数据可视化项目。
附上大佬的GitHub地址,有兴趣的小伙伴可以自行去围观。
https://github.com/Jannchie/Historical-ranking-data-visualization-based-on-d3.js
最后我利用大佬造的轮子,成功实现了25年间各省市GDP数据的可视化。
于是乎,你不就对各省市的GDP了解的一清二楚。
数据来源来自国家统计局。
附上相关链接,其实里面还有好多其他的数据,非常适合拿去练手。
http://data.stats.gov.cn/easyquery.htm?cn=E0103
本次的GDP数据如下,为各地区生产总值。
时间是1993年-2017年,共25年。
网站提供CSV文件下载,但是还是需要规整一下数据。
因为大佬造的轮子对数据有要求。
同时还需要注意一下编码问题,这里的CSV文件需要用gbk编码。
下面是从统计局下载下来的CSV数据。
我偷了个懒,直接就先在表格里删除了前三行,如下。
接下来便是用Python对数据进行规整,代码如下。
import pandas as pd
# 读取数据
df = pd.read_csv( gdp.csv , encoding= utf-8 )
(names, values, dates) = ([], [], [])
# 记得去除地区这个列名,遍历年份
for i in df.columns[1:]:
for j, k in zip(df[i], df[ 地区 ]):
# 输出地区、GDP值、年份数据
print(k, j, i)
names.append(k)
values.append(int(j))
dates.append(int(i.replace( 年 , )))
# 生成DateFrame格式的数据
data = {
name : names,
type : ,
value : values,
date : dates
感谢每一个认真阅读我文章的人,看着粉丝一路的上涨和关注,礼尚往来总是要有的:
① 2000多本Python电子书(主流和经典的书籍应该都有了)
② Python标准库资料(最全中文版)
③ 项目源码(四五十个有趣且经典的练手项目及源码)
④ Python基础入门、爬虫、web开发、大数据分析方面的视频(适合小白学习)
⑤ Python学习路线图(告别不入流的学习)
网上学习资料一大堆,但如果学到的知识不成体系,遇到问题时只是浅尝辄止,不再深入研究,那么很难做到真正的技术提升。
一个人可以走的很快,但一群人才能走的更远!不论你是正从事IT行业的老鸟或是对IT行业感兴趣的新人,都欢迎加入我们的的圈子(技术交流、学习资源、职场吐槽、大厂内推、面试辅导),让我们一起学习成长!