9月29日作业
对收视率等指标的描述性分析
先把文件另存为csv格式 然后读取 然后进行分析
a<-read.csv(file.choose())
a
nrow(a)
ncol(a)
数据共41行18列
以收视率为例,进行数据分析
收视率在第5列
shoushilv<-a[,5]
shoushilv
max(shoushilv)
a[which.max(shoushilv),1]
min(shoushilv)
a[which.min(shoushilv),1]
mean(shoushilv)
median(shoushilv)
var(shoushilv)
sqrt(var(shoushilv))
table(shoushilv)
which.max(table(shoushilv))
由上 得到了最大值及片名 最小值及片名 平均数 中位数 方差 标准差 众数
但在众数上有一个问题 一些数据中不存在众数 但在使用which.max(table(xxx))时仍显示出数据 但此时取的是第一个数 这种情况应该如何避免或者检验?
描述分析结果
做完作业的疑问
1 如何排除不存在众数但显示出现次数唯一的第一个数的情况?
2 一列一列的分析感觉十分繁琐 不知道有没有可以统一分析的方法?