2018年专科组 大数据比赛 第三部分 数据可视化 第5小问

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pandas import DataFrame,Series

df = pd.read_csv("../tiantic.txt",sep='\t')

fig = plt.figure(figsize=(12,6))
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False

ax1 = fig.add_subplot(2,3,1)
df.Survived.value_counts().plot(kind='bar')
plt.title("获救与遇难信息(1为获救)")
plt.ylabel("人数")

ax2 = fig.add_subplot(2,3,2)
df.Pclass.value_counts().plot(kind="bar")
plt.title("乘客等级与人数信息")
plt.ylabel("人数")

ax3 = fig.add_subplot(2,3,3)
plt.scatter(df.Survived,df.Age)
plt.title(" 年龄与获救分布情况")
plt.ylabel("年龄")

# subplot2grid中:colspan=2表示列的跨度为2, rowspan=1表示行的跨度为1。colspan和rowspan缺省, 表示默认跨度为1。
plt.subplot2grid((2,3),(1,0),colspan=2)
# 等级人数的密度图kde
df.Age[df.Pclass  == 1].plot(kind='kde')
df.Age[df.Pclass  == 2].plot(kind='kde')     
df.Age[df.Pclass  == 3].plot(kind='kde')
plt.xlabel("年龄")
plt.legend(("头等舱","1等舱","2等舱"),loc="best")
plt.title("各等级的乘客年龄分布")

ax5= fig.add_subplot(2,3,6)
df.Embarked.value_counts().plot(kind="bar")
plt.title("各登船口岸上船人数")
plt.ylabel("人数")

plt.savefig("2.png")
plt.show()

  • 2
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值