数据分析师系列课程 统计学基础1

基本概念

1、概率:描述某件事情出现的可能性的大小;
2、概率与机会的关系:概率描述了某件事情发生的机会的多少,0-1之间;
3、条件概率:在某种条件或者信息下对事件发生的可能性大小称为条件概率;
4、相关事件:如果几个事件互相有影响,则为相关事件,即一件事件的发生与否会影响另一件事件的发生概率;
5、独立事件:如果几个事件互不影响,则为独立事件,即无论其他事件发生与否,某个事件的发生概率保持不变
6、互斥事件:事件A和事件B不可能同时发生,互斥事件即AB同时发生的概率为0,P(AB)=0;
7、统计:统计是一门收集数据,处理和分析数据,解释数据并从数据中得出结论的科学
8、统计方法分为描述统计和推断统计
(1)描述统计:研究的是数据收集,处理,汇总,图表描述,概括与分析等统计方法,目的是描述数据的特征,找出数据的基本规律。
(2)推断统计:研究如何利用样本数据来推断总体特征的方法。推断统计又分为参数估计和假设检验。
(3)参数估计:即利用样本信息估计总体特征,比如从样本均值估计总体均值
(4)假设检验:即利用样本信息判断对总体的假设是否成立,比如小概率事件,比如反证法
9、变量与常量:都是统计学研究的对象特征,在数量指标中,不变的数量指标称为常量或参数,可变的数量指标称为变量。
(1)按变量值是否连续:分为连续变量和离散变量。离散变量指数值只能用自然数或整数单位计,如人数等;连续变量指在一定区间内可以任意取值的变量,其数值是连续不断的,如身高,血压,体重等。
区分:连续变量是一直叠加上去的,是逐渐增长的,增长量可以划分为固定的单位,即1,2,3…;离散变量是对所有统计对象的计数,增长量是非固定的,不是逐渐增长的。
(2)按变量值是否能量化:分为定性变量与定量变量。可以由数字量化的变量就是定量变量,无法用数字表示的变量就是定性变量,如性别,观点等。
10、数据的类型:
(1)按计量层次:分为数值型(如成绩100分),分类型(如性别分男女),顺序型(如等级分一等、二等、三等)
注意,不同类型数据可以相互转化的
(2)按时间状况:分为截面数据和时序数据。
截面数据指在同一时间,由不同统计单位和相同统计指标组成的一组数据,例如股票数据。不要求统计对象及其范围相同,但要求统计时间相同。
时序数据是在不同时间点上收集到的数据,该类数据反映的是某一现象等随时间的变化状态或程度。如每天气温
11、绝对数与相对数
绝对数:反映客观现象总体在一定时间、地点条件下的总规模、总水平的综合性指标
相对数:指由两个有联系的指标对比计算而得到的数值
12、频数与频率
频数:一组数据中个别数据重复出现的次数(绝对数)
频率:每个小组的频数与数据总和的比值,它代表的是某组在总体中出现的频繁程度(百分数表示,是相对数)
13、百分比与百分点
百分比:表示一个数是另一个数的百分之几,也称百分率或百分数,通常采用%表示,属于相对数
百分点:指以百分数的形式表示的相对指标的变动幅度,比如增长几个百分点
14、比例与比率
比例:指在总体中,各部分数值占全部数值的比重,它反映的是总体的构成和结构
比率:是不同类别数值的对比,它反映的是一个整体中各部分之间的关系
总结,比例指部分占总体的比重,比率指各部分之间的对比
15、倍数与番数
倍数:一个数除以另一个数所得的商
番数:指原来数量的2的N次方,即翻一番 等于 原来的2倍,翻两番 等于 原来的4倍
16、同比与环比
同比:目的是为了与历史同时期进行比较,该指标主要反映的是事物发展的相对情况。比如2019年1月与2018年1月对比。
环比:目的是为了与前一个统计时期进行比较得到的数值,该指标主要反映的是事物逐期发展的情况,比如2019年2月与2019年1月对比。

  • 1
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值