2020-08-25

导入包和数据

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
text = pd.read_csv('C:\\Users\\Administrator\\Desktop\\datawhale\\result.csv')
text.head()

在这里插入图片描述

任务一:跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化

任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)

sex = text.groupby('Sex')['Survived'].sum()
sex

在这里插入图片描述

sex.plot.bar()
plt.title('survived_count')
plt.show()

在这里插入图片描述
【思考】计算出泰坦尼克号数据集中男女中死亡人数,并可视化展示?如何和男女生存人数可视化柱状图结合到一起?看到你的数据可视化,说说你的第一感受(比如:你一眼看出男生存活人数更多,那么性别可能会影响存活率)

a= pd.DataFrame([text.groupby('Sex')['Survived'].count()-sex, sex]).T
a.columns = ['NoSurvived', 'Survived']
a.plot.bar()
plt.title('survived_count')
plt.show()

在这里插入图片描述

任务三:可视化展示泰坦尼克号数据集中男女中生存人与死亡人数的比例图(用柱状图试试)

aa = text.groupby(['Sex', 'Survived'])['Survived'].count().unstack().plot(kind = 'bar', stacked =' False')

在这里插入图片描述

任务四:可视化展示泰坦尼克号数据集中不同票价的人生存和死亡人数分布情况。(用折线图试试)(横轴是不同票价,纵轴是存活人数)
#排序
fare_sur = text.groupby(['Fare'])['Survived'].value_counts().sort_values(ascending = False)
fare_sur

在这里插入图片描述

#排序后绘制折线图
fig = plt.figure(figsize = (20, 18))
fare_sur.plot(grid = True)
plt.legend()#显示图例
plt.show()

在这里插入图片描述

#不排序
fig = plt.figure(figsize=(20, 18))
df.groupby(['Fare'])['Survived'].value_counts().plot(grid=True)
plt.legend()#图例
plt.show()

在这里插入图片描述

任务五:可视化展示泰坦尼克号数据集中不同仓位等级的人生存和死亡人员的分布情况。(用柱状图试试)

aaaa = text.groupby(['Pclass', 'Survived'])['Survived'].count().unstack()
aaaa

在这里插入图片描述

aaaa.plot(kind = 'bar')

在这里插入图片描述
方法二:

pclass_sur = text.groupby(['Pclass' ])['Survived'].value_counts().unstack()
pclass_sur
pclass_sur.plot(kind = 'bar')

【思考】看到这个前面几个数据可视化,说说你的第一感受和你的总结
对于数据,人往往没有直观的概念,而经过绘图展示后人往往对数据有一个清晰的认知。这就是数据可视化的价值所在。
而良好的数据可视化往往需要一些技巧。

任务六:可视化展示泰坦尼克号数据集中不同年龄的人生存与死亡人数分布情况。(不限表达方式)

facet = sns.FacetGrid(text, hue = 'Survived', aspect = 3)
facet.map(sns.kdeplot, 'Age', shade = True)
facet.set(xlim=(0, text['Age'].max()))
facet.add_legend()

在这里插入图片描述

plt.figure(figsize = (16, 10), dpi = 80)
sns.kdeplot(text.loc[text['Survived']==0, 'Age'], shade = True, color = 'g', label="Survived=0", alpha=.7)
sns.kdeplot(text.loc[text['Survived']==1, 'Age'], shade = True, color = 'pink', label = 'Survived = 1', alpha=.8)

在这里插入图片描述

任务七:可视化展示泰坦尼克号数据集中不同仓位等级的人年龄分布情况。(用折线图试试)

#代码编写
text.Age[text.Pclass ==1].plot(kind = 'kde')
text.Age[text.Pclass ==2].plot(kind = 'kde')
text.Age[text.Pclass ==3].plot(kind = 'kde')
plt.xlabel('age')
plt.legend((1, 2, 3), loc = 0)

在这里插入图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值