统计量分析--极差、标准差、变异系数、四分位数间距

本文深入探讨了统计分析中的几个关键概念,包括极差(Range)、标准差(Standard Deviation)、变异系数(Coefficient of Variation)以及四分位数间距(Interquartile Range)。这些量都是衡量数据分布离散程度的重要指标,对于理解数据的波动性和稳定性至关重要。了解这些统计量有助于更准确地解读数据集的特性。
摘要由CSDN通过智能技术生成
#-*- coding: utf-8 -*-
#餐饮销量数据统计量分析
import pandas as pd

catering_sale = 'catering_sale.xls' #餐饮数据
data = pd.read_excel(catering_sale, index_col = '日期') #读取数据,指定“日期”列为索引列
data = data[(data['销量'] > 400)&(data['销量'] < 5000)] #过滤异常数据
statistics = data.describe() #保存基本统计量

statistics.loc['range'] = statistics.loc['max'
分位差是指上分位数与下分位数之差,用来衡量数据的离散程度。它是一种非常简单直观的度量方法,不受极端值的影响,主要用于衡量中位数的代表性。 方差是一组数据与其平均值之差的平方的平均值,它用来衡量数据的离散程度。方差越大,数据越分散;方差越小,数据越集中。方差是最常用的衡量数据离散程度的方法之一。 标准差是方差的平方根,它与方差具有相同的度量单位,但更易于理解和解释。标准差越大,数据的离散程度越大;标准差越小,数据的离散程度越小。 平均绝对离差是一组数据与其平均值之差的绝对值的平均值,它衡量数据的离散程度。平均绝对离差不受极端值的影响,但相对于方差和标准差,它更容易受到异常值的干扰。 变异系数标准差与平均值之比,主要用于比较不同样本数据的离散程度。变异系数越大,表示数据的离散程度越大;变异系数越小,表示数据的离散程度越小。变异系数是一种无量纲的指标,适用于不同单位或量级的数据进行比较。<span class="em">1</span><span class="em">2</span><span class="em">3</span> #### 引用[.reference_title] - *1* *2* [统计学系列——数据分布特征与适用的描述统计量](https://blog.csdn.net/weixin_45665432/article/details/112220875)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] - *3* [数据分析|数据分布特征的描述](https://blog.csdn.net/qq_31405629/article/details/103019415)[target="_blank" data-report-click={"spm":"1018.2226.3001.9630","extra":{"utm_source":"vip_chatgpt_common_search_pc_result","utm_medium":"distribute.pc_search_result.none-task-cask-2~all~insert_cask~default-1-null.142^v93^chatsearchT3_1"}}] [.reference_item style="max-width: 50%"] [ .reference_list ]
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值