笔试题
文章平均质量分 75
存储存储
存储,云
展开
-
精确率 召回率 F1(详细)
精确率召回率等相关知识点经常出现在笔试题中,如果仅考查精确率召回率并不难理解记忆。但是有时结合ROC等知识点时,TP,NP,TN,FN,4个不易区分的符号及各种比率会对初学者的理解产生干扰,本文将几个知识点结合起来举例解释,希望能方便大家理解记忆。背景当我们那一个已知结果的数据对算法进行测试时,不难发现算法对数据判断出现的错误。 当待处理数据简单分为正负两类时,显然 对于原数据来说,只有正负两种原创 2017-02-05 12:56:30 · 1822 阅读 · 0 评论 -
ROC AUC PRC 详细
ROC(receiver operating characteristic curve)受试者工作特征曲线,下图 此图引入了假正率,和真正率。(感觉在读红楼梦) TPR :True Positive Rate(真正率 , TPR)或灵敏度(sensitivity)(就是前文的召回率R) TPR = TP /(TP + FN) 正样本预测结果数 / 正样本实际数 TNR :Tr原创 2017-02-05 13:06:24 · 1899 阅读 · 0 评论 -
分箱问题
问题假设12个销售价格记录组已经排序如下:5, 10, 11, 13, 15,35, 50, 55, 72, 92, 204, 215 使用如下每种方法将它们划分成四个箱。等频(等深)划分时,15在第几个箱子内?等宽划分时在第几个箱?分箱问题分为有监督分箱和无监督分箱。无监督分箱等宽分箱 将变量的取值范围分为k个等宽的区间,每个区间当作一个分箱。 在本问题中变量的取值范围为原创 2017-02-05 16:06:08 · 21320 阅读 · 2 评论