关于基本的R的描述

1.数据来源

略。

2.数据描述

data1<-read.csv("C:\\Users\\Administrator\\Desktop\\user_action_data.csv")
k=nrow(data1[!complete.cases(data1),])#缺失的行数
k
summary(data1)#描述数据
id<-table(data1$ID)#查看频率
id
user_id<-table(data1$USER_ID)#查看频率
user_id
code<-table(data1$CODE)#查看频率
code 
cet_type<-table(data1$CET_TYPE)#查看频率
cet_type
barplot(cet_type)#查看测试类型最多的项目

发现被测试的项目最多的是1-四级和5-考研1.


sort(user_id,decreasing =T)
code<-table(data1$CODE)#查看频率
code 
barplot(code)#查看动作的图例

3.分析目标

*用户在不同时段的访问量情况

*用户在页面上的最喜爱的版面

*用户的访问入口

data3<-read.csv("C:\\Users\\Administrator\\Desktop\\user_action_data3.csv")
summary(data3)
nc<-c(nrow(data3),ncol(data3))#查看数据集的行列数

nc
barplot(table(data3$CET_TYPE),col ="red",main ="笔头网测试人次",xlab="测试类别",ylab="用户量")
table(data3$CODE)
#动作类型
plot(table(data3$CODE))
table(data3$CET_TYPE)
#测试类型

table(data3$CRT_DATE)
#测试时间段
head(sort(table(data3$CRT_DATE),decreasing=T))
barplot(head(sort(table(data3$CRT_DATE),decreasing=T)),main="测试频率较高日期",ylab = "人次",xlab = "日期")
sort(table(data3$USER_ID),decreasing=T) #选出出现频率前6的用户
head(sort(table(data3$USER_ID),decreasing=T))#选出出现频率前6的用户
barplot(head(sort(table(data3$USER_ID),decreasing=T)),main="排在前列的用户测试数量",ylab = "次数",xlab = "用户编号",col ="blue")
user1<-data3[data3$USER_ID ==112872,]#找到用户编号为112872所有行
user2<-data3[data3$USER_ID==118837,]#找到用户编号为118837所有行
user3<-data3[data3$USER_ID==116877,]#找到用户编号为116877所有行
user4<-data3[data3$USER_ID==103826,]#找到用户编号为103826所有行
user5<-data3[data3$USER_ID==5224,]#找到用户编号为5224所有行
user6<-data3[data3$USER_ID==108825,]#找到用户编号为108825所有行
user7<-data3[(data3$USER_ID != 112872)&(data3$USER_ID!=118837)&(data3$USER_ID!=116877)&(data3$USER_ID!=103826)&(data3$USER_ID!=5224)&(data3$USER_ID!=108825),]
#出去测试次数比较多的用户
write.csv(user1,file="C:\\Users\\Administrator\\Desktop\\20150806\\user1.csv")
write.csv(user2,file="C:\\Users\\Administrator\\Desktop\\20150806\\user2.csv")
write.csv(user3,file="C:\\Users\\Administrator\\Desktop\\20150806\\user3.csv")
write.csv(user4,file="C:\\Users\\Administrator\\Desktop\\20150806\\user4.csv")
write.csv(user5,file="C:\\Users\\Administrator\\Desktop\\20150806\\user5.csv")
write.csv(user6,file="C:\\Users\\Administrator\\Desktop\\20150806\\user6.csv")
write.csv(user7,file="C:\\Users\\Administrator\\Desktop\\20150806\\user7.csv")
U1<-c(user1$CODE,user1$CET_TYPE)
plot(table(user1$CET_TYPE))
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值