import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from pandas import DataFrame,Series
df = pd.read_csv("../tiantic.txt",sep='\t')
fig = plt.figure(figsize=(12,6))
plt.rcParams['font.sans-serif']=['SimHei']
plt.rcParams['axes.unicode_minus']=False
ax1 = fig.add_subplot(2,3,1)
df.Survived.value_counts().plot(kind='bar')
plt.title("获救与遇难信息(1为获救)")
plt.ylabel("人数")
ax2 = fig.add_subplot(2,3,2)
df.Pclass.value_counts().plot(kind="bar")
plt.title("乘客等级与人数信息")
plt.ylabel("人数")
ax3 = fig.add_subplot(2,3,3)
plt.scatter(df.Survived,df.Age)
plt.title(" 年龄与获救分布情况")
plt.ylabel("年龄")
# subplot2grid中:colspan=2表示列的跨度为2, rowspan=1表示行的跨度为1。colspan和rowspan缺省, 表示默认跨度为1。
plt.subplot2grid((2,3),(1,0),colspan=2)
# 等级人数的密度图kde
df.Age[df.Pclass == 1].plot(kind='kde')
df.Age[df.Pclass == 2].plot(kind='kde')
df.Age[df.Pclass == 3].plot(kind='kde')
plt.xlabel("年龄")
plt.legend(("头等舱","1等舱","2等舱"),loc="best")
plt.title("各等级的乘客年龄分布")
ax5= fig.add_subplot(2,3,6)
df.Embarked.value_counts().plot(kind="bar")
plt.title("各登船口岸上船人数")
plt.ylabel("人数")
plt.savefig("2.png")
plt.show()