继续上一章节继续写,从数据统计常识开始
数据统计常识
Quartiles, outliers and boxplots
四分位数 Quartiles: Q1(25th percentile), Q3(75th percentile)
四位分数极差 Inter-quartile range: IQR = Q3 –Q1
五数概括 Five number summary: min, Q1, median,Q3, max
盒图 Boxplot: 分布直观表示,体现五数概括
离群点 Outlier: 第三个四分位数之上或者第一个四分位数之下至少1.5 x IQR的值
Variance and standard deviation (sample: s, population: σ)
方差 Variance:
标准差 Standard deviation 方差的平方根
盒图
五数概括:Minimum, Q1, Median, Q3, Maximum
盒的端点在四分位数上,使得盒长度为四分位数极差IQR
中位数用盒内线标记
盒外线延伸到最小和最大的观测值