pandas数据分析之数据可视化

从DataFrame表格中不易发现数据的特征,可以通过将数据制成图表的方式使数据更直观,从而更方便的分析数据。

pandas没有作图功能,但是可以适配matplotlib和seaborn之类的作图库。导入作图库进行数据类型转换,即可画出图像。

pandas内置的plot可以将DataFrame对象转换为制表数据,之后利用matplotlib的plt.show(),就可以作图。

之前学习了unstack函数与stack函数,其实unstack函数除了处理stack()函数返回的数据之外,还有一种用法可以配合GroupBy来使用。

GroupBy函数可以将数据进行多维分组,比如对Sex和Survived两组进行分组,分组之后就是类似Stack函数处理后的类似Series格式。

而这时使用unstack就可以把这个分组数据再转换为二维表,转换出来就像二维概率分布率表类似的那种行和列表示两个变量的格式。

pandas其实有多种作图方法,利用plot子类或者plot方法。plot子类包含了很多作图函数,bar()的意思就是作柱状图。

如果plot方法不指定kind,那么默认就是折线图,指定bar就是柱状图。使用matplotlib的方法就可以对图标进行加工,比如添加表头和网格等等。

研究两个变量之间相关关系的时候,经常使用分类的柱状图。研究船舱和生存人数关系,也可以先Groupby,再利用unstack()生成二维表再进行作图。

如果有多个绘图函数,使用plt.show()时所有的图线都会画在一个图标中。

因为年龄的分布与船舱,性别不同,并不是每个年龄段都有死亡与存活记录,可能有的年龄值只有存活,GroupBy后Unstack会产生空数据,需要分组后使用dropna()进行清洗,再分别作图。 

也可以使用更简单的方法制散点图实现

 

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值