方差膨胀因子(Variance Inflation Factor,VIF):是指解释变量之间存在多重共线性时的方差与不存在多重共线性时的方差之比。容忍度的倒数,VIF越大,显示共线性越严重。经验判断方法表明:当0<VIF<10,不存在多重共线性;当10≤VIF<100,存在较强的多重共线性;当VIF≥100,存在严重多重共线性
setwd('C:/Users/zhangluying/Desktop/建模/数据')
library(dplyr)
library(pROC)
data0<-read.csv('clean_data_1201.csv',stringsAsFactors=F)
head(data0)
names(data0)
#查看每一列数据格式
apply(data0,2,mode)
#查看正负样本比例
length(data0[,1])
length(data0[which(data0$lose_bo==1),1])
length(data0[which(data0$lose_bo==0),1])
#抽样,分为train和test
indexes <- sa