预测模型的类型:
1.分类模型:分类问题中有两类算法
(1)类别输出:比如SVM,KNN等
(2)概率输出:LR,random forest,Gradient boosting,adaboost等都给出概率输出。将概率输出转换为类输出仅仅只需要设定概率阈值
2.回归模型:输出连续值
验证矩阵:
1.混淆矩阵:仅用在类别输出(修改概率阈值会引起矩阵变化)
N×N的矩阵,N代表类别数
2.增益和提升表
3.kolmogorov-smirnov chart
4.ROC曲线 AUC曲线下的面积
5.Gini指数:被用在分类问题=2*auc-1>=60%
6.一致-不一致比率
7.rmse:回归问题,对异常值比较敏感,在之前要处理过
8.k-fold:避免偶然情况,通用