学习笔记——数据的度量

抽样

  • 概率抽样(随机抽样):可以推断总体
    遵循随机原则进行的抽样,总体中每一个单位都有一定的机会被选入样本。具有随机性,不能有带有主观性。概率抽样与等概率抽样是不同的概念。总体中每个单位被抽中的概率是已知或是可以计算出来的。
    概率抽样

  • 非概率抽样:不可推断总体。
    非概率抽样
    ————————————————————————————————————

描述性统计

统计分为描述性统计和推断性统计。
推断性统计包括参数估计和假设检验,通过样本量来估计和检验总体的参数,目的在于认知未知的总体参数及其分布特征。

描述性统计的数据类型

  • 结构数据:

在这里插入图片描述
在这里插入图片描述
在这里插入图片描述

非结构数据:

文本、音频、图片、视频

————————————————————————————————————

描述性统计数据的度量

集中趋势的度量
离散程度的度量
数据分布形态的度量

数据集中趋势的度量

分类数据:众数
顺序数据:中位数和分位数
数值型数据:平均数

众数:一组数据中出现次数最多的变量值。主要用于测度分类数据的集中趋势,也适用于顺序数据和数值型数据集中趋势的测度值。在数据量较大的情况下,众数才有意义。

无众数、一个众数、多众数

中位数:一组数据数据排序后处于中间位置上的变量值。主要用于测度顺序数据的集中趋势,也适用于数值型数据,不适用分类数据。不受极端值的影响。

四分位数:一组数据排序后处于25%和75%位置上的变量值。不受极端值的影响。
下四分位: Q L Q_{L} QL 位置= n 4 \frac{n}{4} 4n
上四分位: Q U Q_{U} QU 位置= 3 n 4 \frac{3n}{4} 43n

平均数:一组数据相加后除以数据的个数得到的结果,为集中趋势的最主要测量值,主要适用于数值型数据不适用于定类和定序数据

总体均值: μ \mu μ

样本均值: x ~ \tilde{x} x~

简单平均数: x ~ = x 1 + x 2 + . . . + x n n = ∑ i = 1 n x i n \tilde{x} =\frac{x_{1} +x_{2}+...+x_{n} }{n} =\frac{\sum_{i=1}^nx_{i} }{n} x~=nx1+x2+...+xn=ni=1nxi

加权平均数(分组问题): x ~ = M 1 f 1 + M 2 f 2 + . . . + M n f n f 1 + f 2 + . . . + f n = ∑ i = 1 n M i f i n

  • 0
    点赞
  • 4
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值