统计是一门收集数据,处理和分析数据,解释数据并从数据中得出结论的科学
(一)统计方法:
1.描述统计:研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法。目的是描述数据的特征,找出数据的基本规律。
2.推断统计:是研究如何利用样本数据来推断总体特征的方法。
推断统计又分为参数估计与假设检验。
参数估计,即利用样本信息估计总体特征。
假设检验,即利用样本信息判断对总体的假设是否成立。
参数估计的原理:
比如:事先给定一容量的样本;已知样本均值,要求估计总体的均值,或者:给定一容量的样本;已知样本方差,要求估计总体的方差。所有参数估计其实就是对总体指标的估计。
假设检验的原理
原理一:小概率事件
小概率原理,就是认为小概率事件在一次试验中是几乎不可能发生的。首先对总体样本的某个假设是真实的,那么不利于(或不支持)这一假设的事件A在一次试验中是几乎不可能发生的;要是在一次试验中事件A竟然发生了,我们就有理由怀疑这一假设的真实性,拒绝这一假设。
原理二:反证法
先提出某种假设(检验假设Ho),再用适当的统计方法确定假设成立的可能性大小,如果可能性小,则认为假设不成立。换句话说:已知在事件A发生的前提下,事件B也一定会跟着发生。那么,我们通过可以证明B没有发生,来间接证明A一定没发生。
(二)常见概念
1.变量和常量:
变量和常量都是统计学研究中的对象特征,在数量指标中,不变的数量指标称为常量或参数,可变的数量指标称为变量。
2.变量类型:
按照变量是否连续:连续变量与离散变量。
离散变量是指其数值只能用自然数或整数单位计算。
连续变量是指在一定区间内可以任意取值的变量,其数值是连续不断的。
按变量值是否能量化:分为定性变量与定量变量。
定量变量,像人的体重,男女生的人数,可以由数字量化的变量就称为定量变量
定性变量,像性别,观点类的无法用数字来表示的变量就称为定性变量。
3.数据类型:
按计量层次:分为数值型,分类型,顺序型
数值型:可以由具体的数值来计算,它是对事物的精确测度。
分类型:性别男女分类,药物反应按阴阳等。无法用数据来进行精确的表达。
顺序型:指各个类别中有程度的差别。比如年级,评价结果不满意,满意,非常满意等顺序排列
不同类型的数据类型之间是可以相互转换的。例如数值型数据可以转化为分类型数据,分类型数据可以转化为数值性数据。
这种数据转化的目的,是为了使分类数据尽可能的量化,以便进行更好的数据分析。
按照时间状况:分为截面数据和时序数据
截面数据:是指在同一时间,由不同统计单位,和相同统计指标组成的一组数据,例如股票数据。截面数据不要求统计对象及统计范围相同,但要求统计的时间相同。
时序数据:是在不同时间点上收集到的数据,这类数据反映的是某一现象等随时间的变化状态或程度。
4.绝对数和相对数
绝对数:是反映客观现象总体,在一定时间,地点条件下的总规模,总水平的综合性指标。
相对数:是指由两个有联系的指标对比计算而得到的数值。
5.频数和频率
频数:是指一组数据中个别数据重复出现的次数
频率:是每个小组的频数与数据总和的比值,它代表的是某组在总体中出现的频繁程度。一般采用百分数表示,所有组的频率加合等于100%。
所以,频数是绝对数,频率是相对数。
6.百分比和百分点
百分比:表示一个数是另一个数的百分之几,也成百分率或百分数,通常采用百分号(%)来表示,它属于相对数。
百分点:是指以百分数的形式表示的相对指标的变动幅度。比如,速度增长了几个点,指数增长了几个点。
7.比例和比率
比例:比例是在总体中,各部分数值占全部数值的比重,它反映的是总体的构成和结构。
比率:比率是不同类别数值的对比,它反映的是一个整体中各部分之间的关系。强调各部分数据的一个对比。
8.倍数和番数
倍数:是一个数除以另一个数所得的商
番数:是指原来数量的2的N次方倍
比如,翻一番=原来的2倍
9.同比和环比
同比:目的是为了与历史同时期进行比较,该指标主要反映的是事物发展的相对情况。比如2014/7与2015/7。
环比:目的是为了与前一个统计时期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况。比如2015/6与2015/7。
(三)概率
1.概率:概率描述了某件事出现的可能性的大小,某件事发生的机会有多少。
- 概率无法精确推断
- 有些概率是可以估计的
2.条件概率:在某种条件或信息下,对事件发生的可能性大小称为条件概率。
- 就是事件A在另外一个事件B已经发生条件下的发生概率。条件概率表示为P(A|B),读作“在B条件下A的概率”。
3.相关事件:如果几个事件互有影响,则为相关事件。
- 即一件事发生与否,会影响另一件事的发生概率
4.独立事件:如果几个事件互不影响,则为独立事件
- 即无论其他事件发生与否,某个事件的发生概率总是保持不变。
5.互斥事件:事件A和事件B不可能同时发生
- 互斥事件意味着AB同时发生的概率为0,即P(AB)=0
参考:B站某视频