数据挖掘基础:描述性数据汇总

本文介绍了数据挖掘中的描述性数据汇总,重点讲解了中心趋势度量,包括分布式度量、代数度量和整体度量。讨论了众数、中列数的概念,提供了中位数近似值的计算公式,并解释了众数在单峰、双峰和多峰数据集中的表现。
摘要由CSDN通过智能技术生成

描述性数据汇总

1 中心趋势度量    

分布式度量 可分布式计算,如sum,count

代数度量  可通过分布式计算运算得到,如avg=sum/count,中列数

整体度量  不可分布式计算,必须整体计算,如中位数median,众数mode

        众数:出现频率最高的数。

       中列数:最大值和最小值的平均值。


公式 

适度倾斜的单频率曲线 :mean - mode=3 * (mean-median)

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值