在R中用最经典的Apriori关联算法对问卷调查结果进行简单的关联分析,包括对规则的筛选,输出以及可视化。
主流程
主流程包括4个部分,数据介绍,关联分析主流程代码,主流程子代码,可视化。
数据介绍
数据包含360份问卷对14个问题的答案,类似下表:
问卷编号 | Q1 | Q2 | Q3 | Q4 | ··· |
---|---|---|---|---|---|
1 | 大三 | 一线城市 | 安全 | 收费情况 | ··· |
2 | 大三 | 一线城市 | 相对安全 | 安全系数 | ··· |
3 | 大三 | 一线城市 | 安全 | 使用方便 | ··· |
关联分析主流程
##读取数据,转换成transaction格式
data <- read.csv("xxx.csv", stringsAsFactors = F)
transaction <- as.transaction(data[,-1],data[,1])
##关联分析,设置support,confidence,对结果按照lift排序
rules <- apriori(transaction, parameter = list(support = 0.5, confidence = 0.7))
quality(rules) <- round(quality(rules), 3)
rules.sorted <- sort(rules, by="lift"