第一部分:描述性统计学的图与表格
1.频数分布——注意:组间距离=(组内最大-组内最小)/组数
2.条形图和饼状图
3.直方图
4.累积图与累积曲线(即是频数分布的进阶版,将大于某个值得频数相加起来并统计)
5.茎叶图
6.交叉分组表(有点类似于概率中的联合分布表格)
此处注意一下的是辛普森悖论,辛普森悖论表示的是未综合的交叉分组表与综合的交叉分组表得到的结论是相反。当交叉分组表包含综合数据时,应该审查是否存在可能影响结论的隐藏变量,使得分开的或未综合交叉分组表结论不同。
7.散点图和趋势线
第二部分:描述性统计数值方法
1.位置的度量
—平均数、中位数、众数、百分位数、四分位数
百分位数的计算:1.数据按升序排列; 2.计算i=(p/100)*n ; 3.若i不是整数,则向上取整数,大于i的下一个整数表示第p百分位数的位置,若i是整数,则用第i项与第i+1项的平均值表示。
4分位数与百分位数计算类似,分别是25%,50%(中位数)、75%位数。