1.数据来源
略。
2.数据描述
data1<-read.csv("C:\\Users\\Administrator\\Desktop\\user_action_data.csv")
k=nrow(data1[!complete.cases(data1),])#缺失的行数
k
summary(data1)#描述数据
id<-table(data1$ID)#查看频率
id
user_id<-table(data1$USER_ID)#查看频率
user_id
code<-table(data1$CODE)#查看频率
code
cet_type<-table(data1$CET_TYPE)#查看频率
cet_type
barplot(cet_type)#查看测试类型最多的项目
发现被测试的项目最多的是1-四级和5-考研1.
sort(user_id,decreasing =T)
code<-table(data1$CODE)#查看频率
code
barplot(code)#查看动作的图例
3.分析目标
*用户在不同时段的访问量情况
*用户在页面上的最喜爱的版面
*用户的访问入口
data3<-read.csv("C:\\Users\\Administrator\\Desktop\\user_action_data3.csv")
summary(data3)
nc<-c(nrow(data3),ncol(data3))#查看数据集的行列数
nc
barplot(table(data3$CET_TYPE),col ="red",main ="笔头网测试人次",xlab="测试类别",ylab="用户量")
table(data3$CODE)
#动作类型
plot(table(data3$CODE))
table(data3$CET_TYPE)
#测试类型
table(data3$CRT_DATE)
#测试时间段
head(sort(table(data3$CRT_DATE),decreasing=T))
barplot(head(sort(table(data3$CRT_DATE),decreasing=T)),main="测试频率较高日期",ylab = "人次",xlab = "日期")
sort(table(data3$USER_ID),decreasing=T) #选出出现频率前6的用户
head(sort(table(data3$USER_ID),decreasing=T))#选出出现频率前6的用户
barplot(head(sort(table(data3$USER_ID),decreasing=T)),main="排在前列的用户测试数量",ylab = "次数",xlab = "用户编号",col ="blue")
user1<-data3[data3$USER_ID ==112872,]#找到用户编号为112872所有行
user2<-data3[data3$USER_ID==118837,]#找到用户编号为118837所有行
user3<-data3[data3$USER_ID==116877,]#找到用户编号为116877所有行
user4<-data3[data3$USER_ID==103826,]#找到用户编号为103826所有行
user5<-data3[data3$USER_ID==5224,]#找到用户编号为5224所有行
user6<-data3[data3$USER_ID==108825,]#找到用户编号为108825所有行
user7<-data3[(data3$USER_ID != 112872)&(data3$USER_ID!=118837)&(data3$USER_ID!=116877)&(data3$USER_ID!=103826)&(data3$USER_ID!=5224)&(data3$USER_ID!=108825),]
#出去测试次数比较多的用户
write.csv(user1,file="C:\\Users\\Administrator\\Desktop\\20150806\\user1.csv")
write.csv(user2,file="C:\\Users\\Administrator\\Desktop\\20150806\\user2.csv")
write.csv(user3,file="C:\\Users\\Administrator\\Desktop\\20150806\\user3.csv")
write.csv(user4,file="C:\\Users\\Administrator\\Desktop\\20150806\\user4.csv")
write.csv(user5,file="C:\\Users\\Administrator\\Desktop\\20150806\\user5.csv")
write.csv(user6,file="C:\\Users\\Administrator\\Desktop\\20150806\\user6.csv")
write.csv(user7,file="C:\\Users\\Administrator\\Desktop\\20150806\\user7.csv")
U1<-c(user1$CODE,user1$CET_TYPE)
plot(table(user1$CET_TYPE))