- 博客(4)
- 收藏
- 关注
原创 机器学习-性能度量
ROC曲线上每一点对应了代价平面上的一条线段,设ROC曲线上点的坐标为(FPR,TPR),则可相应计算出FNR,然后在代价平面上绘制一条从(0,FPR)到(1,FNR)的线段,线段下的面积即表示了该条件下的期望总体代价。若将ROC曲线上的每个点转化为代价平面上的一条线段,然后取所有线段的下界,围成的面积即为在所有条件下学习器的期望总体代价。在进行比较时,若一个学习器的P-R曲线被另一个学习器的曲线完全“包住”,则可断言后者的性能优于前者。F1=2*P*R/(P+R)=2*TP/(样例总数+TP-TN)
2023-07-08 16:04:52
144
原创 机器学习-评估方法
(2)单次使用留出法得到的估计结果往往不够稳定可靠,在使用留出法时,一般要采用若干次随机划分、重复进行实验评估后取平均值作为留出法的评估结果。过拟合:学习器把训练样本学得“太好”了的时候,很可能已经把训练样本自身的一些特点当做了所有潜在样本都会具有的一般性质,这样就会导致泛化性能下降。留一法的评估结果往往被认为比较准确,但在数据集比较大时,训练m个模型的计算开销可能是难以忍受的。将数据集D划分为两个互斥的集合,其中一个集合作为训练集S,另一个作为测试集T。留一法:假定数据集D中包含m个样本,令k=m。
2023-07-07 09:39:05
254
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人