python 数据分析——可视化基础:如何选择可视化图形

在这里插入图片描述

线型图(line)

线型图可以用来表示具有相关性的两个变量的关系,表示一个变量随另一个变量(比如:时间)变化的情况。

注:Pandas 中的 Series 和 Dataframe 都是默认生成的这种图形(使用plot函数)。

柱状图(bar)

柱状图/条形图适合用于少数类别(<10)的分类数据的可视化,用来反映不同类别数据之间的差异。

直方图(histogram)

直方图可以展现数据点的分布情况,是一种可以对值频率进行离散化显示的柱状图。

与此相关的一种图表类型是密度图,它是通过计算“可能会产生观测数据的连续概率分布的估计”而产生的。密度图也被称为 KDE(Kernel Density Estimate,核密度估计)图。

注:直方图和柱状图的区别

  • 柱状图用于分类数据变量,一般条形呈分开排列;直方图用于数值变量,通常是连续排列(直方图的X轴代表将定量变量的数据划分为若干等宽度的区间)
  • 条形图是用条形的长度表示各类别频数的多少,其宽度(表示类别)则是固定的;直方图是用面积表示各组频数的多少,矩形的高度表示每一组的频数或频率,宽度则表示各组的组距,因此其高度与宽度均有意义。

箱线图(box)

箱线图可以展现出比直方图更详细的数据分布情况,其可以用来显示一组数据的中位数,四分位数,和异常值,是一个有用的可视化类型。

箱型的上下两条边分别表示四分之一和四分之三分位点,箱内的线表示中值,虚线条上的条线从盒中伸出以显示数据的范围。

散点图(scatter)

散点图可以直观地展现原始点的分布和两个变量间的关系,是用来观察两个一维数据序列之间的关系的有效手段。
当然,可以有多个变量同时与其中一个变量同时进行观察。

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值