数据可视化(Ⅱ)不同图表的介绍

这里写目录标题

直方图(Histogram)

数据是单一的连续变量
回答数据按照何种形状分布的问题

箱(bin)宽度:
bin=1 噪音较大bin=25峰值
单峰、双峰、三峰

是否对称

离群值在左边,则为左偏发现模式:峭度(kurtosis):根据离群值的不同数量来判断
在这里插入图片描述

箱型图

当拥有连续的变量,并且连续变量被分类变量所分割的时候。
当需要对连续变量在不同分类区间进行数据分布的比较的时候。
在这里插入图片描述

	中值(median)——中位数
	下四分位数(Lower Quartile)有四分之一的数值低于它
	上四分位数(Upper Quartile)
	高四分位和第四分位数之间的差值,称为四分位数间距(inter-Quartile Range)

箱须:

  • 水平的线段成为“箱须(Whisker)”
  • 每个箱体首先沿着各自的方向,延长1.5倍于“四分位数间距”,但是它们延长至最远不超过实际最远的数据点。

特点:

  1. 提供了识别异常值的标准:异常值被定义为[Q1-1.5IQR,Q3+1.5IQR]之外的值,来源于经验判断
  2. 偏态和尾重:
    对于标准正态分布的大样本,只有 0.7%的值是异常值,中位数位于上下四分位数的中央,箱形图的方盒关于中位线对称。
  3. 数据的形状:
    同一数轴上,几批数据的箱形图并行排列,几批数据的中位数、尾长、异常值、分布区间等形状信息便一目了然。
  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值