统计用产品分类目录8位代码类别_描述性统计分析概念概览

本文概述了描述性统计分析的基本概念,包括频数、频率、均值、中位数和众数,并讨论了方差、标准差及其在数据分散性和波动性中的作用。此外,还介绍了变量分类,点估计与区间估计的区别,以及中心极限定理、正态分布和各种统计检验。最后,简要探讨了线性回归分析和模型评估指标。
摘要由CSDN通过智能技术生成

描述性统计分析

描述性统计所提取的统计信息,我们成为**统计量**,其内容包括以下几方面:
  • 频数与频率
  1. 频数:数据中类别变量每个不同取值出现的次数
  2. 频率:每个类别变量的频数与总次数比值,通常百分比表示.
集中趋势分析
  1. 均值:即平均值,其为一组数据的总和除以数据的个数
  2. 中位数 :将一组数据升序排列,位于该组数据中间位置的值,就是中位数.如果数据个数为偶数,则取中间两个数值的均值
  3. 众数:一组数据中出现次数最多的值
  4. 分位数: 数据几分位处对应的值,如1/4处
离散程度分析
  1. 极差:指一组数据中,最大值与最小值之差
  2. 方差:体现一组数据中,每个元素与均值偏离的大小
  3. 标准差:为方差的开方
  4. 三者关系:
  • 方差(标准差) 可以体现数据分散性,方差(标准差)越大,数据越分散,方差(标准差)越小,数据越集中
  • 方差(标准差)可以体现数据的波动性(稳定性),方差(标准差)越大,数据波动越大,方差(标准差)越小,数据波动性越小
  • 当数据较大时,可以用n代替n-1
分布形状
  1. 偏度
  2. 峰度

变量分类:

  • 类别变量
  1. 无序类别变量(名义变量)
  2. 有序类别变量(等级变量)
数值变量
  1. 连续变量
  2. 离散变量
  • 分位数
  1. 1/4分位 `Q1_index=1+(n-1)*0.25`
  2. 2/4分位 `Q2_index=1+(n-1)*0.50`
  3. 3/4分位 `Q3_index=1&#
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值