统计学(2)——统计学介绍

统计是一门收集数据,处理和分析数据,解释数据并从数据中得出结论的科学

(一)统计方法:

1.描述统计:研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。目的是描述数据的特征,找出数据的基本规律。

2.推断统计:是研究如何利用样本数据来推断总体特征的方法。

推断统计又分为参数估计与假设检验。

参数估计,即利用样本信息估计总体特征。

假设检验,即利用样本信息判断对总体的假设是否成立。

参数估计的原理:

比如:事先给定一容量的样本;已知样本均值,要求估计总体的均值,或者:给定一容量的样本;已知样本方差,要求估计总体的方差。所有参数估计其实就是对总体指标的估计。

 

假设检验的原理

原理一:小概率事件

小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。首先对总体样本的某个假设是真实的,那么不利于(或不支持)这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。

原理二:反证法

先提出某种假设(检验假设Ho),再用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立。换句话说:已知在事件A发生的前提下,事件B也一定会跟着发生。那么,我们通过可以证明B没有发生,来间接证明A一定没发生。

 

(二)常见概念

1.变量和常量:

变量和常量都是统计学研究中的对象特征,在数量指标中,不变的数量指标称为常量或参数,可变的数量指标称为变量。

2.变量类型:

按照变量是否连续:连续变量与离散变量。

                                 离散变量是指其数值只能用自然数或整数单位计算。

                                 连续变量是指在一定区间内可以任意取值的变量,其数值是连续不断的。 

按变量值是否能量化:分为定性变量与定量变量。

                                    定量变量,像人的体重,男女生的人数,可以由数字量化的变量就称为定量变量

                                    定性变量,像性别,观点类的无法用数字来表示的变量就称为定性变量。

3.数据类型:

按计量层次:分为数值型,分类型,顺序型

                       数值型:可以由具体的数值来计算,它是对事物的精确测度。

                       分类型:性别男女分类,药物反应按阴阳等。无法用数据来进行精确的表达。

                       顺序型:指各个类别中有程度的差别。比如年级,评价结果不满意,满意,非常满意等顺序排列

不同类型的数据类型之间是可以相互转换的。例如数值型数据可以转化为分类型数据,分类型数据可以转化为数值性数据。

这种数据转化的目的,是为了使分类数据尽可能的量化,以便进行更好的数据分析。

           

按照时间状况:分为截面数据和时序数据

                         截面数据:是指在同一时间,由不同统计单位,和相同统计指标组成的一组数据,例如股票数据。截面数据不要求统计对象及统计范围相同,但要求统计的时间相同。

                         时序数据:是在不同时间点上收集到的数据,这类数据反映的是某一现象等随时间的变化状态或程度。

 

4.绝对数和相对数

绝对数:是反映客观现象总体,在一定时间,地点条件下的总规模,总水平的综合性指标。

相对数:是指由两个有联系的指标对比计算而得到的数值。

5.频数和频率

频数:是指一组数据中个别数据重复出现的次数

频率:是每个小组的频数与数据总和的比值,它代表的是某组在总体中出现的频繁程度。一般采用百分数表示,所有组的频率加合等于100%。

所以,频数是绝对数,频率是相对数。

6.百分比和百分点

百分比:表示一个数是另一个数的百分之几,也成百分率或百分数,通常采用百分号(%)来表示,它属于相对数。

百分点:是指以百分数的形式表示的相对指标的变动幅度。比如,速度增长了几个点,指数增长了几个点。

7.比例和比率

比例:比例是在总体中,各部分数值占全部数值的比重,它反映的是总体的构成和结构。

比率:比率是不同类别数值的对比,它反映的是一个整体中各部分之间的关系。强调各部分数据的一个对比。

8.倍数和番数

倍数:是一个数除以另一个数所得的商

番数:是指原来数量的2的N次方倍

比如,翻一番=原来的2倍

9.同比和环比

同比:目的是为了与历史同时期进行比较,该指标主要反映的是事物发展的相对情况。比如2014/7与2015/7。

环比:目的是为了与前一个统计时期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。比如2015/6与2015/7。

(三)概率

1.概率:概率描述了某件事出现的可能性的大小,某件事发生的机会有多少。

  • 概率无法精确推断
  • 有些概率是可以估计的

2.条件概率:在某种条件或信息下,对事件发生的可能性大小称为条件概率。

  • 就是事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在B条件下A的概率”。

3.相关事件:如果几个事件互有影响,则为相关事件。

  • 即一件事发生与否,会影响另一件事的发生概率

4.独立事件:如果几个事件互不影响,则为独立事件

  • 即无论其他事件发生与否,某个事件的发生概率总是保持不变。

5.互斥事件:事件A和事件B不可能同时发生

  • 互斥事件意味着AB同时发生的概率为0,即P(AB)=0

 

参考:B站某视频

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值