目录:
正文:
一、常见统计量
1、均值、方差
2、中位数、众数
3、上下四分位数
下四分位,即有25%的数小于它的数,
上四分位,75%的数小于它的数。四分位间距=上四分位数-下四分位数,反应变动度指标
由最小值、下四分位数、中位数、上四分位数、最大值五个数可以画出,箱线图
3、峰度、偏度
峰度:
偏度:
例子:南大毕业生薪资分布
一般来说: 都有均值<中位数<众数 或者 均值>中位数>众数
二、广义意义下的统计量
- 定义:统计量是样本的函数 h(x)=g(x1,x2,……,xn) h ( x ) = g ( x 1 , x 2 , … … , x n )
例子:“吓人的”离婚率
日前,民政部发布的《2017年社会服务发展统计公报》显示,2017年我国依法办理结婚登记1063.1 万对,比上年下降7.0%;办理离婚手续的共有437.4 万对,比上年增长5.2%。
把时间再拉长一点,在1990年那一年,全国有951.1万对新人步入婚姻殿堂,80万对夫妻劳燕分飞;27年后的今天,结婚对数是先前的1.1倍,离婚对数是先前的5.5倍。以年度离婚数与总人口之比计算的粗离婚率,自2003年以来就一直没有再下降过。
从全球角度看,在2010年,中国的离婚情况并不算严重。那时,中国的粗离婚率与日本持平,都是2‰,小于韩国的2.4‰;可到了2015年,中国的粗离婚率升至2.8‰,而同期日本和韩国的粗离婚率分别降至1.8‰和2.1‰。
三、推断统计量
- 定义:推断性统计使用从总体中随机抽取的数据样本,描述总体并对其进行推断。
1、假设检验
从样本推断总体:
例子:员工平均的下班时间
例子:张学友演唱会
四、极限分布
1、大数定理
样本量 n n 只要越来越大,我把这个独立同分布的数加起来去除以 n n 得到的这个样本均值(也是一个随机变量)会依概率收敛到真值,但是样本均值的分布是怎样的我们不知道。
2、中心极限定理
只要期望方差有限,当样本量n只要越来越大,这独立同分布的 n n 个数的样本均值会趋近于正态分布,并且这个正态分布以为均值, σ2/n σ 2 / n 为方差。
五、利用概率指导生活
千分之百分之一的事件是不可能发生的
例:利用小概率事件编程——搜索算法
例:为什么银行是流氓
例:神经网络单层节点个数为什么不能无限多
例:为什么我总觉得我的代码老是报错
参考目录:
https://baike.baidu.com/item/%E5%B3%B0%E5%BA%A6
https://www.zhihu.com/question/48256489
https://baike.baidu.com/item/%E7%AE%B1%E5%BD%A2%E5%9B%BE/10671164?fromtitle=%E7%AE%B1%E7%BA%BF%E5%9B%BE&fromid=10101649&fr=aladdin