1.统计学
统计学可以分为:描述统计学与推断统计学
描述统计学:使用特定的数字或图表来体现数据的集中程度和离散程度。例:每次考试算的平均分,最高分,各个分段的人数分布等,也是属于统计学的范围。
推断统计学:根据样本数据推断总体的数据特征。例:产品质量检查,一般采用抽检,根据所抽样本的质量合格率作为总体的质量合格率的一个统计
应用:统计学的应用十分广泛,可以说,只要有数据,就有统计学的用武之地。目前比较热门的应用:经济学,医学,心理学等
2.掌握内容
均值:算数平均数
中位数:将数据按大小排列后位于正中间的数描述,描述中等水平
众数:数据中出现最多的数
3.示例
均值举个例子:
中位数举个例子:
众数举个例子:
4.优缺点:
5.离散程度
比较数据 A:1,2,5,8,9 B:3,4,5,6,7
图中A的分散性比B大
6.方差
在统计学上,更常地是使用方差来描述数据的离散程度–数据离中心越远越离散
方差简化公式:
例如1,2,5,8,9
(1*1+2*2+5*5+8*8+9*9)/5 -pow((1+2+5+8+9)/5)
=35-23
=10
7.标准差
由数据1,2,5,8,9,求出方差为10,与原数据比较,可以看出10比原数据都大,是否说明这一组数据十分离散呢??–但是方差与元数据的单位是不一样的,这样的比较是无意义的。如果原数据的单位是m的话,那么方差的单位就是m的二次方。
为了保持单位的一致性,我们引入一个新的统计量—-标准差
标准差:有效的避免了因单位而引起的度量问题
与方差一样,标准差的值越大,表示数据越分散
8.了解数据构成的图
直方图、箱线图、茎叶图、线图、柱形图、饼图等图可准确描述数据在使用中的作用度。