对于一个学习器,一个二分类问题,其预测结果,可分为四类,真正例(TP),假正例(FP),真反例(TN),假反例(FN);
准确率:分类正确的样本数量占总体样本数量的比例;(TP+TN)/(TP+FP+TN+FN)
查准率:英文叫precision,对某一类判断的准确率进行度量,一般称为正例;真正例除以判断为正例的数量,TP /(TP+TN);如果查准率极高比如说100%,预测股票上涨为正例,那么该学习器预测出来的股票都会上涨;说明该学习器对某一种上涨规律已经完全掌握,实现完美预测;
查全率:recall,也称之为召回率;TP /(TP+FN);如果股票今天上涨有2000支,而你只预测出了10支,那么查全率就是非常低的;
对于股票交易而言:查准率是极为重要的;查全率再低也没关系;
对于"P-R曲线"
每条曲线代表一个学习器;而每条曲线的点对应不同的分类阈值;进而可以调节查准率从1到0;
个人总结:准字就代表有判断错误的样本在里面;而全字就代表没有判断错误的样本;