商务与经济统计阅读笔记1

本文详细介绍了统计学的基础知识,包括描述统计和统计推断。描述统计涉及数据的汇总,如频数分布、图形展示等;统计推断涵盖样本数据对总体的估计和假设检验。文中还讨论了数据位置度量(如平均数、中位数、众数)、变异程度度量(如标准差、方差)以及分布形态和异常值检测。此外,文章涵盖了随机变量、概率分布、抽样分布和点估计等内容,深入浅出地阐述了统计学在商务和经济领域的应用。
摘要由CSDN通过智能技术生成

统计是搜集、分析、表述和解释数据的艺术和科学。

描述统计用表格、图形和数值方法来汇总数据。

统计推断是利用样本数据估计总体特征并进行假设检验的过程。

汇总分类变量的数据:频数分布,相对频数分布和百分数频数分布,条形图和饼形图。

汇总数量变量的数据:频数分布,相对频数分布和百分数频数分布,打点图,直方图,累积分布,茎叶显示。

用表格方法汇总两个变量的数据:交叉分组表,

辛普森悖论:依据综合和未综合数据得到的相反结论称为辛普森悖论。

用图形显示方法汇总两个变量的数据:散点图和趋势线,复合条形图和结构条形图。

散点图是对两个数量变量间关系的图形描述,趋势线显示相关性近似程度。


通过样本得到的统计数据称为样本统计量,来自总体的统计数据叫总体参数。在统计推断中,样本统计量被称为相应总体参数的点估计量。

3.1 对数据位置的度量:平均数,中位数,众数,四分位数。

平均数是数据中心位置的度量。

加权平均数:给每个观测值赋予了不同的权重。

几何平均数:常用于分析增长率。


中位数:对变量中心位置的度量。

众数:出现次数最多的数。

四分位数:将数据划分为四部分,每部分包含约1/4的观测值,这些分割点称为四分位数。

3.2 变异程度的度量:极差,四分位间距,方差,标准差,标准差系数。

极差:最大值减最小值。

四分位间距:第三四分位数减第一四分位数。

方差:总体方差是求出每个观测值和平均值之差的平方,求和,再除数据个数。样本方差的话分母是数据个数减一。


标准差:方差开方。

标准差系数:标准差除平均数乘100%。

3.3 分布形态,相对位置的度量以及异常值的检测

分布形态:对称的分布,平均数和中位数是相等的,当数据偏度是正时(右偏),平均数通常比中位数大,左偏则相反。

z分数:等于观测值减平均值,再除标准差,表示观测值距离平均值有多少个标准差。

切比雪夫定理:75%的数据在平均数加减两个标准差的范围内,89%在三个标准差范围内,94%的数据在四个标准差范围内。对分布形态没有要求。

经验法则:对钟形分布,68%的数据在平均数的一个标准差内,95%在两个标准差内,几乎所有的在3个标准差内。

异常值检测:对钟形分布,平均值加减三个标准差外的数据视为异常值。另一种方法,以第一四分位数减1.5倍四分位间距为下线,第三四分位数加1.5倍四分位间距为上限,这个范围之外的数据视为异常值。

3.4 五数概括法和箱型图

五数:最小值,第一四分位数,中位数,第三四分位数,最大值。

箱型图


3.5 两变量间关系的度量:样本协方差,相关系数。

协方差

样本协方差,

  • 3
    点赞
  • 9
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值