根据一个变量按某一数值型变量计算频率或者占比也许很简单,呐SQL,两个呢,或许用SQL就开始大想特想,消耗脑细胞。
I’m coming!
数据描述:有三列数据,前两列是分类变量,第三列是数值型变量。
过程是这个样子的:
1.将两个分类变量的取值分别作为二维列联表的行跟列,呀!列联表用上啦,没错xtabs()来啦;
2.然后按照行或者列求比列就是了,没错,就是prop.table();
3.是二维列表怎磨破,as.data.frame()很强大,威武;
4.这样就可以画图了;
5.要是想把频数也加进来,我天,sqldf()各种匹,为啥不用merge()或者data.table包里的东东?笨蛋!这里有两个分类变量,两个条件我选SQL,and,and,and到底!
That’s all!简直可爱到哭!
chdata <- read.csv('CH\\CHdata.csv',encoding = 'utf8')
mytable <- xtabs(count.1.~ip_province+ISP