R 获取向量元素的众数

最新推荐文章于 2024-07-17 08:13:05 发布

梦想画家

最新推荐文章于 2024-07-17 08:13:05 发布

阅读量1.4k

点赞数 1

文章标签： r语言概率论开发语言

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/neweastsun/article/details/122136538

版权

众数是数据集中出现频次最高的元素，与平均值、中位数不同，众数可以是数值也可以是字符数据。

R 发现众数

R 内置的mean、median是标准函数，用于计算均值和中位数。mode函数却与我们期望的不一样，mode函数返回数据对象的存储类型。R 没有提供内置函数计算众数，我们只能自定义函数实现。

众数是要计算数据集中出现次数最高的元素集合，可能有多个元素出现频率相同。
在这里插入图片描述

自定义函数

下面我们定义函数计算向量的众数：

rv <- c(11, 18, 19, 21, 29, 46, 21, 19, 11)

imode <- function(x){
  ## 返回不重复元素序列
  uniq <- unique(x)
  
  ## 返回不重复元素在原数据集中的频次
  freq <- tabulate(match(x, uniq))
  
  ## 计算最大频次
  mf <- max(freq)
  
  ## 返回所有最大频次位置的元素集合
  uniq[freq == mf]
}

imode(rv)
# 返回三个元素
# [1] 11 19 21

下面我们看字符串类型是否正确返回。

rc <- c("a", "c", "y", "o", "b", "c", "y", "x", "a" )
imode(rc)

rc1 <- c("a", "c", "y", "o", "b", "c", "y", "x", "a", "c" )
imode(rc1)

# [1] "c"

结果如我们期望。我们计算众数经常用于使用众数填充缺失值，但如果返回多个值无法填充，因此现改进imode返回第一个众数：


imode0 <- function(x){
  ## 返回不重复元素序列
  uniq <- unique(x)
  
  ## 返回不重复元素在原数据集中的频次
  freq <- tabulate(match(x, uniq))
  
  ## 计算第一个最大频次元素位置
  mf <- which.max(freq)

  ## 返回所有最大频次位置的元素集合
  uniq[mf]
}

rc <- c("a", "c", "y", "o", "b", "c", "y", "x")
imode0(rc)
# [1] "c"

返回结果如预期，当然上面最后三行代码可以精简为：uniq[which.max(tabulate(match(x, uniq)))]。

博客等级

码龄23年

1226
原创

1万+
点赞

1万+
收藏

5186
粉丝

关注

私信

热门文章

分类专栏

数据分析工程 226篇
Airflow 28篇
人工智能 93篇
编程语言
python 254篇
Golang 133篇
R语言 69篇
Rust 27篇
C&C++ 7篇
数据库 111篇
ClickHouse 32篇
PostgreSQL 81篇
ElasticSearch 47篇
DuckDB 33篇
kafka 10篇
云原生 11篇
Prometheus 6篇
java 98篇
spring 92篇
groovy 7篇
深入理解Javascript 35篇
操作系统 4篇
数据结构与算法 6篇
工具软件 113篇
程序感悟 9篇
设计模式 20篇

展开全部收起

上一篇：: R 矩阵相关计算函数汇总

下一篇：: R pacman 最快捷安装加载插件包

最新评论

Apache Druid 架构深度解析：构建高性能分布式数据存储系统
征途黯然.: Druid中如何优化段大小和缓存策略以提升查询性能？
InfluxDB性能瓶颈破解：查询缓存设计模式与内存存储调优秘籍
CSDN-Ada助手: 恭喜你这篇博客进入【CSDN每天值得看】榜单，全部的排名请看 https://bbs.csdn.net/topics/619739575。
Scrapy 核心组件解析：Request & Response 的深度应用与实战
北风之神c: 夫爬虫之道，调度为本！今有奸雄Scrapy，窃据七载，拥趸数万，挟Twisted以令诸侯，仗Request而制六合。然吾观其根基，十败已定！吾FunBoost十胜在手，当为天下主！一曰：道胜 Scrapy锁闭如铁狱，函须重写，类必继承，此谓框架奴役！吾@boost临阵，函数自骋，不拘一格，此谓自由天道！二曰：义胜 Scrapy拆骨为器，parse/item/pipeline，代码流离！吾单文件定乾坤，调度/解析/存储，万法归宗！三曰：治胜 Scrapy调Request如驱羊，纵千军难控秒息！吾执令牌桶为鞭，QPS量沙准刻，分秒不爽！四曰：度胜彼浏览器交互若临渊，异步变废材！吾selenium长驱直入，多轮操作如履坦途，同步亦能碎星辰！五曰：谋胜 Scrapy传递参数如盲人探囊，meta藏晦！吾函数形参列阵待敌，IDE烛照万里，毫发毕现！六曰：德胜 Scrapy单元测试似扛鼎，需千钧力！吾单函直刺要害，调试若烹小鲜，瞬息可验！七曰：仁胜回调地狱深千仞，开发者折戟沉沙！吾平铺直叙若长江，思维奔涌一泻千里，自然之道！八曰：明胜中间件如九连环，解此失彼！吾自定义函数似龙泉，一挥断万绳，锐不可当！九曰：文胜断点续爬如纸帐，风卷即破！吾消息确认作金城，宕机重启岿然不动，永固河山！十曰：武胜分布式空有其名，蜷伏单机！吾四重并发裂苍穹，千机万核尽归麾下，气吞八荒！此十胜十败，昭如日月！今携@boost令旗，会猎于爬虫之野：东收Selenium精骑，西纳Playwright锐甲；南引Redis消息狼烟，北聚RabbitMQ铁阵！诸君且看—— 函数过处，Request伪军望风溃！装饰器指天，分布式王旗插遍！待扫清回调余孽日，与诸将共饮调度器，贺万物皆可Boost！剑锋所指之处：回调地狱崩解！框架枷锁斩断！开发者再不必叩拜Spider宗庙！此乃爬虫之文艺复兴，调度之工业革命！——FunBoost大都督布告天下你阅读这个文档，豁然开朗： https://funboost.readthedocs.io/zh-cn/latest/articles/c8.html
python numpy 中linspace函数
SAKUTA KUNN: 是的。arange相当于python里的range，range的参数是起始值结束值步长，而arange的参数列表只不过多一个元素类型。步长可以看作是公差了。
LangGraph系列教程：深入解析Checkpointers与InMemoryStore组件
穿越23小时: 完全理解错了用法。。。 store是键值对存储，用于存储跨线程记忆的； checkpointer是存储state状态的，存储的是对话信息

大家在看

最新文章

2025

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。