统计学task1

1>统计学基础知识

均值:一组数相加后除以这一组数的个数。
中位数:一组数从小到大排列,最中间的那个数,如果是偶数个,两个相加后除以2,得到中位数。
众数:这一组数中出现多的一个数字。
极差:指一组数中最大数和最小数的差值,它描述这些数字分开的有多远, 差值越小,数据分布得越紧密。
中程数:指数据集中最大数和最小数的平均值,是考虑集中趋势的又一种方式,是考虑中间值的有一种方法。
象形统计图的目的主要是为了使统计数据更为直观、通俗易懂。
线形图适合用来表示随时间变化的事物,展示变化趋势。此外,还有条形图,折线图,饼图,茎叶图,盒须图…
随机变量:它并非传统意义上的变量,而更像是从随即过程映射到数值的函数。例如仍骰子的出现点数。
概率密度函数:1.离散随机变量中每个变量概率有值且有意义。2.连续随机变量中某个具体变量概率值为0,而一个变量范围内的概率有值且有意义,概率密度是一个函数,用于计算连续变量某一范围空间内的概率。
期望:随机变量的期望值是总体的均值,但因是无穷,所以采取每个结果可能出现的概率作为权重后计算。
对于二项分布的期望,E(X)=np,其中n是试验次数,p是每次成功的概率。

2>二项及泊松分布
二项分布是一种具有广泛用途的离散型随机变量的概率分布,它是由贝努里始创的,所以又叫贝努里分布。
二项分布是指统计变量中只有性质不同的两项群体的概率分布。所谓两项群体是按两种不同性质划分的统计变量,是二项试验的结果。即各个变量都可归为两个不同性质中的一个,两个观测值是对立的。因而两项分布又可说是两个对立事件的概率分布。
二项分布用符号b(x.n.p),表示在n次试验中有x次成功,成功的概率为p。
  二项分布的概率函数可写作:
  b(x.n.p)=C_nxpxq^{n-x}
  式中x=0、1、2、3.....n为正整数
  C_n^x=\frac{n!}{x!(n-x)!}
Poisson分布,是一种统计与概率学里常见到的离散概率分布。
泊松分布的参数λ是单位时间(或单位面积)内随机事件的平均发生次数。 泊松分布适合于描述单位时间内随机事件发生的次数。

在这里插入图片描述
3>大数定律
定义:如果样本量足够大,那么样本均值将趋近于期望值。
大数定律分为弱大数定律和强大数定律。
重要定律:切比雪夫大数定律,伯努利大数定律…

4>正态分布
在这里插入图片描述正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%。
横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%。
横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。
由于“小概率事件”和“假设检验”的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值