机器学习中的数学(1):频数

最近在学习统计学,为数据挖掘学习打基础。以下是对一些简单统计学知识的归纳介绍。

频数

也叫次数,指一个特定组或者特定区域内的对象数据目,表现各对象的频繁程度。例如:游戏公司开发的游戏下载量

游戏下载量
类别数量
体育35896
策略343892
动作767653
射击34556
其他678

游戏下载数据量代表了各游戏类别的频数,频数越大说明该类型的游戏越受到大众喜欢,以上的频数可以为公司游戏开发方向进行指导。

频数密度

指频数在分组数据中的密集程度。频数密度 = 频数 / 组距。

例如:

类别游戏种类数量数量频数密度
体育33589611965.3
策略2343892171946.0
动作1176765369786.6
射击6345565759.3
其他3678226.0

表中可以明显看出虽然策略游戏下载总量低于动作游戏,但是策略游戏的频数密度远高于动作游戏,由此可以综合考虑游戏爱好者的游戏倾向。

有上可以看出频数密度展现了某个特定区间中的数据密集度。通过这种方法可以对有差别的区间进行比较。为决策者提供数据方向。

累计频数

累积频数就是将各类别的频数逐级累加起来。其方法有两种:

一是从类别顺序的开始一方向类别顺序的最后一方累加频数(定距数据和定比数据则是从变量值小的一方向变量值大的一方累加频数),称为向上累积;

二是从类别顺序的最后一方向类别顺序的开始一方累加频数(定距数据和定比数据则是从变量值大的一方向变量值小的一方累加频数),称为向下累积。通过累积频数,可以很容易看出某一类别(或数值)以下及某一类别(或数值)以上的频数之和。

累计频数用曲线图可以很直观的体现某一对象在一个方向上的变化趋势。例如下图:

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值