多元线性回归的适用条件:
(1)自变量对应变量的变化具有显著影响
(2)自变量与应变量间的线性相关必须是真实的,而非形式上的
(3)自变量之间需有一定的互斥性
(4)应具有完整的统计数据
训练数据:csv格式,含有19维特征
数据下载地址:http://pan.baidu.com/s/1eSx1fwe
步骤一:数据读取及预处理
从vt.csv文件中读取训练数据,从
rm(list = ls(all=TRUE))
library(car)
library(corrplot, quietly=TRUE)
library(sqldf)
## 数据读取
folder <- "file:///D:/My Documents/R/"
# 销量分3类读取
name <- "vt.csv"
namepre <- "vp.csv"
path <- paste(folder,name,sep = "");
pathpre <- paste(folder,namepre,sep = "")
# 训练集
dataset <- read.csv(path, na.strings=c(".", "NA", "", "?"), strip.white=TRUE