假设有100个样本,其中正样本70,负样本30,这个是由数据集本身决定的,机器要做的就是判别这100个样本中哪几个样本是正样本,哪几个样本是负样本。
现在机器做出了预测:
机器把原样本中70个正样本中的50个判为正,记为TP=50(True Positive,机器判断正确的正样本);
机器把原样本中70个正样本中的20个判为负,记为FN=50(False Negative,机器判断错误,认为该样本是负样本,但它是正样本。可以理解为“机器错误的认为它是负样本,负负得正所以它本来的面目应该是正样本”);
机器把原样本中30个负样本中的10个判为正,记为FP=10(False Positive,机器判断错误,认为该样本是正样本,但它是负样本。可以理解为“机器错误的认为它是正样本,那它本来的面目是负样本”);
机器把原样本中30个负样本中的20个判为负,记为TN=20(True Negative,机器判断正确的负样本);
a c c u r a c y = T P T P +