原标题:Pandas可视化指南:手把手从零教你绘制数据图表
via:量子位,编译:晓查
数据可视化本来是一个非常复杂的过程,但随着Pandas数据框plot函数的出现,使得创建可视化图形变得很容易。
最近,一位来自印度的小哥以2019年世界幸福指数的数据为例,详细讲述了在Pandas中plot函数的绘制常用图形的小技巧,熟练掌握这些技巧后,你也能绘制出丰富多彩的可视化图表。
导入数据
在绘制图形前,我们首先需要导入csv文件:
importpandas aspd
df=pd.read_csv(‘./world-happiness-report-2019.csv’)
df.head(3)
这个csv图表的内容是各个国家按照不同维度评价的幸福指数(数据下载地址https://share.weiyun.com/5XazJL1):
数据框中一些列的名称比较冗长,可以重命名使其更加简洁:
df.rename(columns={“Country (region)”: “Country”, “Log ofGDPnper capita”: “Log_GDP_per_capita”, “Healthy lifenexpectancy”:”Health_life_expect”},inplace=True)
df.columns
绘制柱状图、散点图等常见图形
从最近简单的柱状图开始,只统计腐败程度、自由度、宽容度、社会支持等几个维度
%matplotlib tk
df1=df[: