按组距为300编制频数表,计算频数,频率和累积频率表,并绘制直方图
某厂对50个计件工人某月份工资进行登记,获得以下原始资料(单位:元)
试按组距为300编制频数表,计算频数,频率和累积频率表,并绘制直方图。要求写出用R语言进行基本统计的程序(数据可以从mvexec4.xls中获得)。
(1)获取数据的变量名和数据的长度如何求频数
大写x是excel中研究数据的变量名,一定要绑定数据attach();
结束后释放数据detach();
> attach(mvexec4)
> > names(mvexec4)
[1] "X"
> length(X)
[1] 50
> hist(X,breaks = seq(0,3000,by=300),col = 1:7)
breaks = seq(0,3000,by=300)是设置一个区间范围
求频率
m<- seq(0,3000,by=300)
hist(X,m,freq = F,col = 1:7)
#freq = F就是求频率,freq = T就是求频数(hist(X,m,freq = T,col = 1:7))
求累积频率
> cumsum(X) #求累积
[1] 1465 3225 5210 7480 10460 11835 13570 15510 17730 20400 21805 23560
[13] 25525 27765 30585 31880 33525 35405 37515 40065 41420 43130 45040 47230
[25] 49830 51095 52720 54585 56680 59200 60425 62030 63875 65915 68345 69520
[37] 71115 72950 74980 77350 78350 79885 81695 83705 85995 87120 88695 90510
[49] 92540 94860
> M <- seq(0,96000,by=3000)
> hist(Cumsum,M,freq = F,col = 1:12,las=3)