统计基础

统计基础概念

统计学是根据样本的情况去推断总体的情况,很大部分统计分析都基于概率。统计学首先还是要研究已知现象的规律,然后去推断总体的情况。其第一步使用的方法有很多,如果处理的对象是随机变量,则会使用到概率论的方法。如果处理的对象是存在关联关系的多元变量,则可能使用回归分析等方法。研究出规律后,还需要去评估这些规律是否能很好的代表总体的情况。

总体:所要考察对象的全体叫做总体。根据研究目的确定的同质观察单位的全体。更确切地说,它是根据研究目的确定的同质观察单位某种变量值的集合。

个体:构成总体的每个成员,叫做个体。

样本:从总体中所抽取的一部分个体叫做总体的一个样本。由总体中随机抽取部分观察单位的变量值组成。样本是总体中有代表性的一部分。主要样本是一个群体概念,表示表示单个的意思,注意跟样品的概念进行区分。最常见的抽样方法,比如“简单随机抽样”。

样本的容量是有限的,不可能包含总体中的所有个体,假如样本中包含了n个个体,则n称为样本容量,简称为样本量。从总体中抽取的样本总是希望能够很好的代表总体。

样品:个体也是构成样本的成员,在样本中把个体称作样品。

统计量:统计量是统计理论中用来对数据进行分析、检验的变量。对一个考察对象而言,总体是不可知道的,能拿来分析的只有样本,而统计量是只依赖于样本x1,x2,…xn的变量。也就是统计量就是对样本中的样品进行运算转换得来的变量,经过一些处理后,也就有了特定的物理含义,可以作为评价样本,并进一步评价总体的有价值变量。例如,样本均值(即α1)和样本方差是常用的两个统计量,前者反映总体中心位置的信息,后者反映总体分散情况。

参数估计:根据样本的统计量去估计相应总体的参数的过程,即是参数估计。比如根据样本的均值估计总体的均值。参数估计有两种:点估计和区间估计。

点估计:用样本量作为总体参数的估计值就是点估计。比如把样本的均值作为总体的均值,就是点估计。点估计的方法常用的有矩法和极大似然法。

区间估计:样本相对于总体其样本容量总是有限的,所以统计量正常总是趋近于总体的参数,而不会是完全等于总体的参数。所以我们往往在点估计的基础上包裹上一个邻域,即得到一个区间估计。

点估计周围的这个邻域的大小是怎么确定的呢?一个最直接的答案就是:确定一个百分比,p%,使得给定任意数据集(样本),参数的估计值(estimation),也就是这个样本的统计量落在这个邻域内的概率为p%。那么,确定邻域大小的问题就变成了确定参数估计量(estimator)分布的问题了。

 

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值