评估方法的优缺点

1、过拟合:当学习器把训练样本学的太好,很可能把已经训练的样本特点当做了所有潜在样本都会有的一般性质,这样就会导致泛华能力下降(泛化能力指学习的模型应用在未知的样本中的能力)。

2、欠拟合:指学习能力低下,认为很一般的特点都是所有的特点。

评估方法:

  1. 留出法:若训练集包含绝大多数样本,则训练出的样本可能就接近想要的训练模型,但是由于测试集较小,评估结果可能就不够准确,基本划分的数据集的模式:2:1,4:1前面分别用做训练,后面的用作测试。
  2. 交叉验证法:等分,分层采样,取均值,缺陷则是:在数据集较大开销太大,花费时间较多。
  3. 自助法:循环从整体数据中取放进样例中,又放回的抽取,最终初始数据有0.368的样本未出现,用于测试。自助法能从初始数据集中出现的样本用于测试,这样的测试也称为包外估计。优点:自助法在数据集较小,难以有效划分训练\测试集时候很有用,能从初始数据集中产生多个不同的训练集,缺点:但是改变了数据集分布,这会引入估计偏差

但是在初始数据量足够时候,留出法和交叉验证法更常用。

调参与最终参数模型:

调参的一般准则:对每个参数选定一个范围和一个变化的步长,这是这是在计算开销与性能的折中方案。

性能度量:衡量模型泛华能力的度量,性能不仅取决于算法和数据,还决定任务需求。

回归任务最常用的性能度量均方误差。

查全率 (TP/(TP+FN))、查准率(TP/(TP+FP)):TP真正例 FP假正例 TN真反例 FN假反例

F1是基于查全率与查准率的调和平均定义的:2*TP/(样例总数+TP-TN)

ROC:受试工作特征。  横轴TPR(真正例)=TP/(TP+FN),纵轴FPR(假正例):FP/(TN+FP)。

规范化:将不同变化范围的值映射到相同固定范围内,常见的是[0,1],也称归一化。

偏差:期望输出与真实标记的差别,刻画学习算法本身的拟合能力。

泛化误差可分解为偏差、方差(度量了同样大小训练集的变动所导致的学习性能的变化吗,刻画了数据扰动所造成的影响)、与噪声(表达了在当前任务上任何学习算法所能达到的期望泛化误差的下界)之和。

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
灰色综合评价法是一种综合评价方法,它主要用于处理评价指标之间存在不确定性和不完全信息的情况。下面是灰色综合评价法的优缺点: 优点: 1. 考虑了指标之间的不确定性:灰色综合评价法能够有效地处理指标之间存在不确定性和不完全信息的情况,对于那些无法精确量化的因素进行评价有一定的帮助。 2. 能够提供相对较准确的评价结果:通过综合考虑各个指标的权重和重要性,灰色综合评价法能够得出相对较准确的评价结果,为决策提供参考依据。 3. 灵活性较强:在使用灰色综合评价法时,可以根据具体情况设定不同的指标权重和重要性,以满足不同决策场景的需求。 缺点: 1. 主观性较强:灰色综合评价法在确定指标权重和重要性时,往往需要依赖专家经验或主观判断。这种主观性可能会导致评价结果存在一定程度的偏差。 2. 对数据要求较高:灰色综合评价法需要较多的数据作为评价依据,而且这些数据应该具备一定的可靠性和准确性。如果数据不足或者质量不高,评价结果可能会受到影响。 3. 处理复杂问题困难:灰色综合评价法在处理复杂问题时可能面临困难,因为很难准确地确定各个指标之间的关系和权重,导致评价结果不够准确或者不完全符合实际情况。 总之,灰色综合评价法作为一种综合评价方法,在一些特定的应用场景下具有一定的优势,但也存在一些局限性需要注意。对于具体问题的评价,需要结合实际情况综合考虑是否采用该方法
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值