数据分析学习:泰坦尼克号实战
数据可视化
男女中生存人数分布
sex = data.groupby('Sex')['Survived'].sum()
sex.plot.bar()
plt.title('survived_count')
plt.show()
由图可以看出女性比男性的生存人数要多
不同票价的人生存和 死亡人数分布情况
fare_sur = data.groupby(['Fare'])['Survived'].value_counts().sort_values(ascending=False)
fig = plt.figure(figsize=(20, 18))
fare_sur.plot(grid=True)
plt.legend()
plt.show()
不同仓位等级的人生 存和死亡人员的分布情况
import seaborn as sns
sns.countplot(x="Pclass", hue="Survived", data=data)在这里插入代码片
不同年龄的人生存与 死亡人数分布情况
facet = sns.FacetGrid(data, hue="Survived",aspect=3)
facet.map(sns.kdeplot,'Age',shade= True)
facet.set(xlim=(0, text['Age'].max()))
facet.add_legend()
或者
data.Age[data.Survived==1].plot(kind='kde')
data.Age[data.Survived==0].plot(kind='kde')
plt.xlabel("age")
plt.legend(1,loc="best")
plt.show()
不同仓位等级的人年 龄分布情况
data.Age[data.Pclass == 1].plot(kind='kde')
data.Age[data.Pclass == 2].plot(kind='kde')
data.Age[data.Pclass == 3].plot(kind='kde')
plt.xlabel("age")
plt.legend((1,2,3),loc="best")