数据分析task04(2021-06-21)

第二章:数据可视化
matplotlib可视化图案的适用场景:
展示趋势变化:
1.线图也叫折线图,常用来呈现时间趋势的变化
2.面积图和折线图从形式上看非常相似,区别只是面积图在折线图的基础上,填充了折线下面的区域,可以让人更直观的看出数据的变化趋势。
3.堆积面积图:
堆积面积图是基础面积图的延伸,它将多个类别的数据变化都显示在一个图形中。它具有以下特点:
1.不会出现不同分类的数据点被遮盖,被隐蔽的状况
2.堆积面积图与标准面积图不同。某一分类的值并非与纵坐标完全对应,而是通过折线之间的相对高度来表达。
3.堆积面积图不仅可以展示各类的发展趋势(面积图和折线图都能表示这个)。可以表达总体的发展趋势和个种类间的关系。比如重要程度,大致占比等
展示分布关系:
1.小提琴图:主要用来展示多组数据的分布状态及概率密度
2.箱型图:以一种利于变量之间比较或不同分类变量层次之间比较的方式来展示定量数据的分布矩形框显示数据集的上下四分位数,而矩形框中延伸出的线段(触须)则用于显示其余数据的分布位置,剩下超过上下四分位间距的数据点则被视为“异常值”。
箱型图的基本作用如下:
数据异常值
箱形图为我们提供了识别异常值的一个标准:异常值被定义为小于Q1-1.5IQR或大于Q3+1.5IQR的值。
偏态和尾重
箱型图揭示了数据批分布偏态和尾重的部分信息,尽管它们不能给出偏态和尾重程度的精确度量,但可作为我们粗略估计的依据。
数据的形状
同一数轴上,几批数据的箱形图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息便一目了然。在一批数据中,哪几个数据点出类拔萃,哪些数据点表现不及一般,这些数据点放在同类其它群体中处于什么位置,可以通过比较各箱形图的异常值看出。
3.直方图:只能接受数值类型的变量数据。
4.密度图:与直方图类似,同样用来战术数值型变量的分布情况
展示相关关系:
1.散点图:常用于查看数值型变量之间的相关性,同时可以利用不同颜色来区分样本所属的类别。
2.热力图:更多用来表示数值变量的总体信息
3.气泡图:适用于超过二维特征的可视化,一般可以用起泡的变化和大小来表示第三维,第四维的特征,可以认为是散点图的衍生
展示排序关系:
1.柱状图:用来展示一个类别变量和一个数值变量之间的关系,是展示此类信息对有效的方式之一
2.雷达图:一种展示多个定量变量的二维图标,所有变量交汇在中心同一点,但是由于使用限制较多,爱可视化中一般较少用到。
3.平行坐标图:主要用来比较样本在一组数据型变量上的特征,它是雷达图的另一种表现形式,在可视化中更

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

来碗孟婆汤,三分糖去冰多放香菜

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值