09-11 概率基础

本文介绍了概率统计的基础知识,包括数组的集中趋势(均值、中位数、众数)、离散程度(极差、方差、标准差)以及频度分析和数据分布。强调了在分析中选择合适统计量的重要性,如在有异常值时使用中位数而非均值。同时,文章讲解了正态分布的概念,以及如何从频度、集中趋势、离散程度和分布全面理解统计样本。
摘要由CSDN通过智能技术生成

概率统计基础

一、 数组的集中趋势

集中趋势最能包含数组关键特征

均值 –
避免使用的情况:样本中极值且极值在使用场景中不常出现(即是否有异常值)

中位数—比均值好在不受极端值的影响;

众数—很好的反应的数据的集中趋势(用户量最大);

EXCEL: 函数
均值 average
中位数median
Quartile() 0-最小值,1,下四分位数,2-中位数,3-上四分位数,4-最大值
众数 mode

R
均值:mean
中位数 median
众数: 无内置函数

二、 数组的离散程度

极差,方差,标准差 三个数据来分析离散程度,离散程度考察数据的稳定性

极差—
最大值-最小值
比如 某地的温差过大
方差—
每一个变量与总体均值间的差异,但是实际过程中总体数据很大,故合理的采用样本均值来代替总体均值;
[(x1-x均)^2+…+ (xn-x均)^2]/(n-1)

标准差
方差开方
因为方差平方的不止是数值,还有数据的单位,为了将方差的单位还原成盒原数组一致,引入标准差。

EXCEL和R语言中的实现

EXCEL

	极差: MAX-MiN
	方差:Var(数组)
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值