学习笔记——数据的度量

最新推荐文章于 2024-07-18 18:43:19 发布

JX.Zeng

最新推荐文章于 2024-07-18 18:43:19 发布

阅读量2.7k

点赞数

分类专栏：学习笔记文章标签：统计学习数据度量人工智能

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_44936813/article/details/96485125

版权

抽样

概率抽样（随机抽样）：可以推断总体。
遵循随机原则进行的抽样，总体中每一个单位都有一定的机会被选入样本。具有随机性，不能有带有主观性。概率抽样与等概率抽样是不同的概念。总体中每个单位被抽中的概率是已知或是可以计算出来的。
非概率抽样：不可推断总体。

————————————————————————————————————

描述性统计

统计分为描述性统计和推断性统计。
推断性统计包括参数估计和假设检验，通过样本量来估计和检验总体的参数，目的在于认知未知的总体参数及其分布特征。

描述性统计的数据类型

结构数据：

在这里插入图片描述

非结构数据：

文本、音频、图片、视频

————————————————————————————————————

描述性统计数据的度量

集中趋势的度量
离散程度的度量
数据分布形态的度量

数据集中趋势的度量

分类数据：众数
顺序数据：中位数和分位数
数值型数据：平均数

众数：一组数据中出现次数最多的变量值。主要用于测度分类数据的集中趋势，也适用于顺序数据和数值型数据集中趋势的测度值。在数据量较大的情况下，众数才有意义。

无众数、一个众数、多众数

中位数：一组数据数据排序后处于中间位置上的变量值。主要用于测度顺序数据的集中趋势，也适用于数值型数据，不适用分类数据。不受极端值的影响。

四分位数：一组数据排序后处于25%和75%位置上的变量值。不受极端值的影响。
下四分位： $Q_{L}$ 位置= $\frac{n}{4}$
上四分位： $Q_{U}$ 位置= $\frac{3n}{4}$

平均数：一组数据相加后除以数据的个数得到的结果，为集中趋势的最主要测量值，主要适用于数值型数据，不适用于定类和定序数据。

总体均值： $\mu$

样本均值： $\tilde{x}$

简单平均数： $\tilde{x} =\frac{x_{1} +x_{2}+...+x_{n} }{n} =\frac{\sum_{i=1}^nx_{i} }{n}$

加权平均数（分组问题）：

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
学习笔记——数据的度量

学完统计后，为加深记忆并方便以后复习，写下学习笔记。
复制链接

扫一扫

专栏目录

JX.Zeng CSDN认证博客专家 CSDN认证企业博客

码龄5年

4: 原创

133万+: 周排名

117万+: 总排名

8703: 访问

: 等级

134: 积分

4: 粉丝

8: 获赞

0: 评论

27: 收藏

私信

关注

热门文章

分类专栏

2
学习笔记 3篇

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。