### 活跃时间段相关分析 ###
logindata <- read.csv("data//logindata.csv")
library(caret)
dmy <- dummyVars(~.,data = logindata)
dmyTsrf <- data.frame(predict(dmy,newdata = logindata))
dim(dmyTsrf)
str(dmyTsrf)
symnum(cor(dmyTsrf))
# 导入自定义的求相关系数函数
source("code//CorrelationFunction.R")
corMasterList <- flattenSquareMatrix(cor.prob(dmyTsrf))
# 按照相关系数的绝对值进行降序排序
corList <- corMasterList[order(-abs(corMasterList$cor)),]
# 提取与“是否付费.是"的相关系数大于0.04的记录
selectedSub <- subset(corList,(abs(cor))>0.04 & i %in% c("是否付费.是"))
bestsub <- as.character(selectedSub$j)
# #
library(corrplot)
corrplot.mixed(cor(dmyTsrf[,c('是否付费.是',bestsub)]),
lower = "ellipse",upper = "number",
tl.pos="lt",diag="u")
corrplot(cor(dmyTsrf$'是否付费.是',dmyTsrf[,bestsub]))
symnum(cor(dmyTsrf[,c('是否付费.是',bestsub)]))
关于相关性分析常用的方法可以参考:https://blog.csdn.net/arielle512/article/details/81234501