数据可视化 —— 泰坦尼克任务

第二章:数据可视化

开始之前,导入numpy、pandas以及matplotlib包和数据

#导入numpy、pandas以及matplotlib包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
# 导入数据(result.csv这个文件)
df = pd.read_csv(r'result.csv')
df.head()

2.7 如何让人一眼看懂你的数据?

2.7.1 任务一:跟着书本第九章,了解matplotlib,自己创建一个数据项,对其进行基本可视化

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

data = pd.Series(np.random.randn(1000),index=np.arange(1000)) # 生成随机数据
data =data.cumsum() # 进行数据的累加
data.plot()  # 绘图
plt.show()   # 展示

在这里插入图片描述

【思考】最基本的可视化图案有哪些?分别适用于那些场景?(比如折线图适合可视化某个属性值随时间变化的走势)
【思考回答】

散点图:用于发现各变量之间的关系。
柱状图:展示多个分类的数据变化和同类别各变量之间的比较情况。
条形图:展示多个分类的数据变化和同类别各变量之间的比较情况。
折线图:展示数据随时间或有序类别的波动情况的趋势变化。
饼图:用来展示各类别占比,比如男女比例。
热力图:以特殊高亮的形式显示访客热衷的页面区域和访客所在的地理区域的图示。
箱型图:用来展示一组数据分散情况,特别用于对几个样本的比较。
词云图: 展现文本信息,对出现频率较高的“关键词”予以视觉上的突出,比如用户画像的标签。
雷达图:将多个分类的数据量映射到坐标轴上,对比某项目不同属性的特点。
漏斗图:用梯形面积表示某个环节业务量与上一个环节之间的差异,可以直观地显示转化率和流失率。

2.7.2 任务二:可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)。

# 可视化展示泰坦尼克号数据集中男女中生存人数分布情况(用柱状图试试)
# 分组用 groupby   计算用 sum
sex = df.groupby('Sex')['Survived'].sum()
sex
sex.plot.bar() #  柱状图

  • 2
    点赞
  • 49
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
数据可视化是数据科学领域中重要的一环,它通过图表、图形和其他可视化工具将数据呈现出来,以便能够更好地理解和分析数据。 首先,数据可视化可以帮助我们更好地理解数据。通过将数据可视化成图表或图像,我们可以直观地看到数据的分布、趋势和模式。这些可视化结果可以让我们更容易地发现数据中的有意义的信息,并且帮助我们深入理解数据所传达的含义。 其次,数据可视化还可以帮助我们发现数据中的异常值。通过对数据进行可视化,我们可以快速地发现与众不同的数据点或异常模式。这些异常值可能是我们的数据收集过程中的错误,或者是数据背后隐藏的重要信息。通过识别和处理这些异常值,我们可以提高数据质量和分析的准确性。 此外,数据可视化也有助于数据的传达和沟通。在现实世界中,不同背景的人对于数据的理解能力和统计分析的能力有所差异。数据可视化可以帮助我们以更直观的方式向其他人传达数据,使得他们更容易理解和接受数据的分析结果。通过合适的图表和图形,我们可以有效地解释数据背后的趋势和关系,并与其他人进行更有意义的讨论和决策。 综上所述,数据可视化在数据科学中起着重要的作用。它不仅帮助我们更好地理解和分析数据,发现异常值,还能够向他人有效传达和沟通数据。因此,在进行数据科学工作时,数据可视化是必不可少的一项技能和工具。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值