统计学总结

一、离散型概率分布和连续型概率分布

在这里插入图片描述
在这里插入图片描述

  • 离散型概率分布
    求随机变量x取某个特定值的概率.
    (1)二项分布
    成立条件:每次试验成功的概率均是相同的,记录为p;失败的概率也相同,为1-p。每次试验必须相互独立,该试验也叫做伯努利试验,重复n次即二项概率。
    公式:
    在这里插入图片描述

(2)泊松分布
成立条件: 在任意两个长度相等的区间中,时间发生的概率是相同的,并且事件是否发生都是相互独立的。
x代表发生x次,u代表发生次数的数学期望,概率函数为:
在这里插入图片描述
(3)几何分布

每次试验成功的概率为p,首次成功出现在第k次的概率:
P ( X = k ) = ( 1 − p ) k − 1 p {P(X=k)=(1-p)^{k-1}p} P(X=k)=(1p)k1p,k=1,2……

  • 连续型概率分布

    随机变量在某个区间内取值的概率。
    (1)均匀分布
    在这里插入图片描述

(2)正态分布
在这里插入图片描述
在这里插入图片描述
标准正态分布:均值u=0,标准差σ=1
在这里插入图片描述
累计分布函数:概率密度函数的积分.F(x) = P(X<=x).
在这里插入图片描述

在这里插入图片描述
在这里插入图片描述
计算三种类型的概率(这里需要说明一点,只有标准正态分布时,随机变量才用z表示):

● z小于或者等于某个给定值的概率,直接带入分布函数得出
如:p(z<=1)=φ(1)=0.8413 (1值左边标准正态曲线下的面积)

● z在给定的两个值之间的概率
如:P(-1<=z<=1.25) = P(z<=1.25) – P(z<=-1) =φ(1.25)-φ(1) =0.735

● z大于或者等于某个给定值的概率
如:P(z>1) = 1-P(z<=1) =1-φ(1)= 0.1586

标准正态分布与一般的正态分布的关系:
在这里插入图片描述
(3)指数概率分布
在这里插入图片描述
在这里插入图片描述

在这里插入图片描述

  • 泊松、指数区别

泊松分布:是离散型概率分布,描述每一区间中事件发生的次数。
指数分布:是连续型概率分布,描述事件发生的时间间隔的长度。
举例:
在这里插入图片描述

二、抽样及其分布

1.中心极限定理:设从均值为μ,方差为σ²(有限)的任意一个总体中抽取样本量为n的样本,当n充分大时,样本均值x̄的抽样分布近似服从均值为μ,方差为σ²/n 的正态分布。

2.点估计
在这里插入图片描述
3.抽样分布

(1)样本均值的抽样分布
在这里插入图片描述
n是样本容量,N是总体容量,σ是总体标准差,σx拔是样本标准差

● 如果总体服从正态分布时:任何样本容量下的(x拔)的抽样分布都是正态分布。

● 总体不服从正态分布时:
a.中心极限定理:从总体中抽取容量为n的简单随机样本,当样本的容量额很大时,样本均值(x拔)的抽样分布近似服从正态概率分布。
b.其实在大多数的应用中,样本容量大于30时,(x拔)的抽样分布近似服 从正态概率分布

(2)样本比率的抽样分布

在这里插入图片描述
(3)样本方差的抽样分布只讨论总体分布为正态分布时候的情况
设总体分布为N~(μ,σ²), X1,X2,…Xn为来自正态分布的样本,样本方差s²:
在这里插入图片描述
两样本方差比的分布:
(s2x/s2y ) / (δ11 δ22)~ F(n1-1,n2-1)

4.统计学三大分布
在正态总体条件下,主要的抽样分布有卡方分布,t分布,F分布,常称为统计三大分布。
(1)χ2分布
若随机变量X₁,X₂,… , Xn相互独立,且服从标准正态分布,则随机变量X
在这里插入图片描述
称为服从自由度为n的卡方分布。
在这里插入图片描述
在这里插入图片描述
(2)t分布
设随机变量X ~ N(0,1),Y~χ2(n),且X与Y独立,在这里插入图片描述
为t分布
在这里插入图片描述
在这里插入图片描述
(3)F分布
在这里插入图片描述
在这里插入图片描述

三、描述性统计理论

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述
异众比率:非众数组的频数占总频数的比例。主要用于衡量众数对一组数据的代表程度。
离散系数(变异系数):一组数据的标准差与其相应的平均数之比。离散系数主要用于比较不同样本数据的离散程度。
在这里插入图片描述

参数估计

1.总体均值的区间估计
(1)总体均值的区间的估计:σ已知情形
在这里插入图片描述

有关顾客购物消费额的问题,根据历史数据,σ=20美元,并且总体服正态分布。现在抽取n=100名顾客的简单随机样本,其样本均值(x拔)=82美元。求总体均值的区间估计。
在这里插入图片描述
所以u的区间估计是(78.08,85.92)

(2)总体均值的区间估计:σ未知情形

在这里插入图片描述

假设检验

假设检验是对总体参数做一个尝试性的假设,该尝试性的假设称为原假设,然后定义一个和原假设完全对立的假设叫做备选假设。
完整解释
在选择显著性标准α时,是在 H0为 真的前提下进行的。
正常情况下事件结果和H0相差不远,如果发生了与H0不一致的、概率小于α的事件时,则拒绝H0,否则不拒绝H0该做法保证犯第一类错误概率不超过α,但不知道犯第二类错误的概率。

(1)总体均值的检验:σ已知情形
质检机构检查某品牌咖啡的标签上显示装有3磅咖啡,现在质检机构需要确定每罐咖啡的质量至少有三磅,以保证消费者权益。已知道σ=0.18,现在取得n=36罐咖啡组成一个随机样本,计算出(x拔)=2.92
在这里插入图片描述
单边检测:拒绝原假设:p<α,|z|>|zα|
在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

方差分析

分类数据分析

  • 0
    点赞
  • 10
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值