分位数,也称之为分位点,最常见的有中位数,四分位数等。以中位数为例,将数据集从小到大排列后,50%区域对应的点就是中位数。同理,四分位数分别对应25%, 50%, 75%, 依次称之为第一四分位数,第二四分位数,第三四分位数,其中第二四分位数就是中位数了,3个四分位数将数据划分为了4个区间,这也是其名字中四的由来。
箱形图的优点:
- 直观明了地识别数据批中的异常值
- 利用箱线图判断数据批的偏态和尾重
箱形图的缺点:
1. 不能精确地衡量数据分布的偏态和尾重程度;
2.对于批量比较大的数据,反映的信息更加模糊以及用中位数代表总体评价水平有一定的局限性