dummyVars函数:dummyVars creates a full set of dummy variables (i.e. less than full rank parameterization----建立一套完整的虚拟变量
先举一个简单的例子:
survey
survey
## service
## 1 very unhappy
## 2 unhappy
## 3 neutral
## 4 happy
## 5 very happy
# 我们可以直接增加一列rank,用数字代表不同情感
survey
survey
## service rank
## 1 very unhappy 1
## 2 unhappy 2
## 3 neutral 3
## 4 happy 4
## 5 very happy 5
显然,对于单个变量进行如上处理并不困难,但是如果面对多个因子型变量都需要进行虚拟变量处理时,将会花费大量的时间。
下面用caret包中的dummyVars函数对因子变量进行哑变量处理。
library(caret)
## Loading required package: lattice
## Loading required package: ggplot2
customers
mood=c("happy","sad","happy","sad","happy"),outcome=c(1,1,0,0,0))
customers
## id ge