数据学习第二周笔记

一、 集中趋势的度量
集中趋势是指一组数据项某一中心值靠拢的程度,它反映了一组数据中心点的位置所在。
1、 众数
① 众数是一组数据中出现次数最多的变量值(不具备唯一性),众数主要用于测度分类数据的集中趋势
② 一般情况下,只有在数据量较大的情况下众数才有意义
③ 众数是一个位置代表值,它不受数据中极端值的影响
④ 从数据分布的角度看,众数是一组数据分布的最高峰点

2、 中位数
① 中位数是一组数据排序后处于中间位置上的变量值,它将全部数据等分为两部分,主要用于测度顺序数据的集中趋势
② 中位数是一个位置代表值,不受极端值影响
③ 在研究收入分配时中位数很有用
当一组数据的分布偏斜程度较大时,使用中位数是一个比较好的选择

3、四分位数
① 四分位数也成为四分位点,它是一组数据排序后处于25%(下四分位数)和75%(上四分位数)位置上的值

4、 平均数、
平均数也成为均值,它是一组数据相加后除以数据的个数得到的结果,是集中趋势的最主要测度值,主要用于测度数值型数据的集中趋势。
① 根据未经分组数据计算的平均数成为简单平均数
② 根据分组数据计算的平均数成为加权平均数
③ 几何平均数是n个变量值成绩的n次方根,用G表示。
a. 几何平均数主要用于计算平均比率,当个所掌握的变量值本身是比率形式时,采用几何平均法计算平均比率更为合理。
b. 几何平均数主要用于计算现象的平均增长率。
平均数是应用最广泛的集中趋势测度值,但其容易受数据极端值的影响,并且对于偏态分布的数据,平均数的代表性比较差。

二、 离散程度的度量
数据的离散程度是数据分布

  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值