视频课程笔记1

集中趋势在统计学中是指一组数据向某一中心靠拢的程度,它反映了一组数据中心的位置所在。

研究中实际观测或调查的一部分个体称为样本,研究对象的全部称为总体

均值: 一组数相加后除以这一组数的个数。

样本均值:在这里插入图片描述

总体均值:在这里插入图片描述

中位数: 一组数从小到大排列,最中间的那个数,如果是偶数个,两个相加后除以2,得到中位数。

众数: 这一组数中出现多的一个数字。

极差: 指一组数中最大数和最小数的差值.

中程数: 指数据集中最大数和最小数的平均值.

方差用来表述数据和均值之间的偏离程度。样本方差不同于总体方差。

总体方差:
在这里插入图片描述
样本方差:
在这里插入图片描述

标准差是表述数据和均值之间的偏离程度的另一个重要标志。它等于方差的平方根。

标准差: 在这里插入图片描述

随机变量是表示随机现象各种结果的变量。萨尔曼认为随机变里并不是传统意义上的变量,而是一种由随机过程映射到数值的函数。

分为离散型与连续型随机变量

概率密度函数:
1离散随机变量中每个变量概率有值且有意义
2连续随机变量中某个具体变量概率值可为0,而一个变量范围内的概率有值且有意义,概率密度是一个函数,用于计算连续变量某一范围空间内的概率。

二项分布即重复n次的伯努利试验,在每次试验中只有两种可能的结果。

在这里插入图片描述

期望值的本质就是总体无穷时的总体均值。

计算时可用频率进行加权平均。
二项分布的期望值E(X)=np,其中n为随机试验次数,p为某一次的成功概率。

泊松过程是一种累计随机事件发生次数的最基本的独立增量过程,它其实就是二项分布的极限情况。

在这里插入图片描述

大数定律的概念其实很简单,也就是样本数里足够多的时候,样本均值趋近于总体均值,或者说随机变量的期望值。

正态分布

概率密度函数:在这里插入图片描述
z分数: 离整体均值有多少个标准差。

正态曲线下,横轴区间(μ-σ,μ+σ)内的面积为68.268949%。

横轴区间(μ-1.96σ,μ+1.96σ)内的面积为95.449974%。

横轴区间(μ-2.58σ,μ+2.58σ)内的面积为99.730020%。

由于“小概率事件”和“假设检验”的基本思想 “小概率事件”通常指发生的概率小于5%的事件,认为在一次试验中该事件是几乎不可能发生的。由此可见X落在(μ-3σ,μ+3σ)以外的概率小于千分之三,在实际问题中常认为相应的事件是不会发生的,基本上可以把区间(μ-3σ,μ+3σ)看作是随机变量X实际可能的取值区间,这称之为正态分布的“3σ”原则。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值