真阳性、假阳性、真阴性、假阴性:TP、FP、TN、FN
精确率:Precision
召回率:Recall
特异性:Specificity
F1值:F1 score
准确率:Accuracy
混淆矩阵:x轴为Prediction,y轴为Label
P | N | |
P | TP | FN |
N | FP | TN |
ROC曲线的横纵坐标均为0到1,其中,横坐标为假正率FP,纵坐标为真正率TP。
ROC曲线的凸起程度越高,模型性能越好。对角线表示随机猜测,没有任何预测的价值。
AUC表示ROC曲线下方的面积。
AUC = 1表示完美分类器,该模型至少存在一个阈值,可以将正负样本完美地分开。
0.5 < AUC < 1表示优于随机猜测,数值越大,分类器越好。
t-SNE可视化是一种非线性的降维算法,常用于将数据降维到二维或者三维空间进行可视化,来观察数据的结构。例如此图