1.准备数据
最小值
第一四分位数Q1
中位数
第三四分位数Q3
最大值
2. 利用股价图绘制出箱线图的基本框架
因为股价图只需要 4行数据,所以暂时挪走 mid的数据,如下图
a>将数据横向排列,选择数据,创建股价图,如下
b>添加中位值数据:
点击上面绘制的图 --->选中数据源 ----->添加数据 mid ---->将mid的数据排到中间来----->点ok
在绘制的图中,选中刚添加的mid数据,修改其标记特性,如下:
到这一步,箱线图的基本模型就出来了。
3.将最大值及最小值的标记调成 ' - ', 然后大致的箱线图就出来了。
这样子制作的箱线图比较粗糙,看教程介绍,还会涉及到 四分位差,以便排除异值。
------------------------------------------------------------------------------------------------------------------------
further
由于现实数据中总是存在各式各样地“脏数据”,也成为“离群点”,于是为了不因这些少数的离群数据导致整体特征的偏移,我们需要清洗掉这批异常值。
首先先定义 【四分位差 IQR = Q3(75%分位数) - Q1(25%分位数)】
(ps:四分位差的定义 = 反映了中间50%数据的离散程度。数值越小,数据越集中。数值越大,数据越分散)
箱线图的最小观测值 = Q1-1.5 IRQ ; 箱线图的最大观测值 = Q3 + 1.5 IRQ
箱线图的界限在(Q1-1.5IQR,Q3+1.5个IQR),界限外部的所有值均为异常值。
》》》》
重新定义界限后,我们将会得到箱线图新的最大值和最小值,可以重新绘制箱线图。
另外,excel里面暂时没有办法将异常值(即大于Q3 + 1.5IQR,小于Q1-1.5IQR)在箱线图表现出来。
但是R语言,Python可以!有待研究。
另外,2016 excel也可以直接生成。
听说 power BI 也可以绘制箱线图,有待研究。