根据两个分类变量按某一数值型变量计算频率

最新推荐文章于 2022-09-16 17:20:35 发布

Watch_dou

最新推荐文章于 2022-09-16 17:20:35 发布

阅读量1.6k

点赞数

分类专栏： get小技巧

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012111465/article/details/77970024

版权

本文介绍了如何使用SQL处理复杂的统计问题，即根据两个分类变量，计算它们各自在数值型变量上的频率和占比。通过将分类变量转化为列联表，然后利用prop.table()函数求比例，再通过as.data.frame()转换为数据框，最后可能结合sqldf()处理两个分类变量的条件筛选，实现统计分析。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

根据一个变量按某一数值型变量计算频率或者占比也许很简单，呐SQL，两个呢，或许用SQL就开始大想特想，消耗脑细胞。
I’m coming!
数据描述：有三列数据，前两列是分类变量，第三列是数值型变量。
过程是这个样子的：
1.将两个分类变量的取值分别作为二维列联表的行跟列，呀！列联表用上啦，没错xtabs()来啦；
2.然后按照行或者列求比列就是了，没错，就是prop.table()；
3.是二维列表怎磨破，as.data.frame()很强大，威武；
4.这样就可以画图了；
5.要是想把频数也加进来，我天，sqldf()各种匹，为啥不用merge()或者data.table包里的东东?笨蛋！这里有两个分类变量，两个条件我选SQL，and,and,and到底！

That’s all！简直可爱到哭！

chdata <- read.csv('CH\\CHdata.csv',encoding = 'utf8')
mytable <- xtabs(count.1.~ip_province+ISP

最低0.47元/天解锁文章

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。