matlab 统计数组频数_week2-描述性统计

本文介绍了MATLAB中统计数组的集中趋势和离散程度,包括众数、中位数、平均数、四分位差、极差、方差和标准差等概念,并探讨了它们在不同数据类型中的应用和影响。
摘要由CSDN通过智能技术生成

096c79df29e8b8bcc838d31143c9eb42.png

1.集中趋势

集中趋势即用一个数据来表示整个数据集,反映了一组数据中心点的位置所在

1.1分类数据

众数

  • mode,样本量中出现次数最多的数,可能有多个,如果所有的数据都只出现1次,可以认为不存在众数,也可以认为所有的数据都是众数。
  • 位置代表值,不受数据中极端值影响。
Excel: mode(number1, number2, ...)

1.2顺序数据

中位数

  • median,数据排序后处于中间的位置。
  • 将数据分成两半,左边小于中位数,右边大于中位数;可以理解为二分位数
  • 将样本数据排序后,取位于中间的数。
  • 如果样本量n为奇数,中位数为第(n+1)/2个数;如3个样本量,中位数为第2个数;
  • 如果样本量为偶数,中位数为中间两个数的平均数,即n/2n/2 +1个数的平均数。如4个数,中位数为取第2和第3个数的平均数。
  • 不适用于分类数据
  • 位置代表值,不受极端值影响
Excel : median(number1, number2, ...)

分位数

  • 用n-1个点将数据等分成n个部分,产生了:四分位数(quartile),十分位数(decile),百分位数(percentile)的概念。
  • 四分位数也称四分位点,是数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值;
  • 3个点4等分,排序后找到1/4位置和3/4位置的数。
  • 一个例子说明如何计算样本量不能被4整除的四分位数:

302761209b64ab45b97ff420ad75714c.png
  • Excel: quartile(array, quart), array为要计算的数据集,拖选区域即可;quart=0,返回最小值;1返回下四分位数,2返回中位数,3返回上四分位数,4返回最大值。

1.3数值型数据

平均数

  • mean,样本数据总和除以样本个数
  • 数据的重心,数据误差相互抵消后结果
  • 不适用于分类数据和顺序数据
  • 受数据中极值影响
  • 算术平均数:simple mean,未
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值