机器学习(一) 拟合

一、拟合 欠拟合 过拟合

1.拟合:
根据训练样本中学习出适用于所有潜在样本的“普遍规律”,这样在遇到新样本时做出正确的判别,即具有很好的泛化能力。
2.欠拟合
是指对训练样本的一般性质没有学好,即无法更好的判别测试样本。
3.过拟合
当学习器把训练样本学习的很“优秀”,即在训练集上表现优秀,近似完美的预测或者区分出了所有的数据,但是在新的测试样本集却无法正确预测或者区分,缺乏泛化能力。

二、解决过拟合和欠拟合的问题

1.针对欠拟合问题:
欠拟合通常是由于学习能力低下造成的,欠拟合比较容易克服,增大数据量;
例如在决策树学习中扩展分支、在神经网络学习中增加训练轮数。
2.针对过拟合问题:
导致过拟合的因素有很多,其中最常见的情况是由于学习能力过于强大,以至于把训练样本所包含的不太一般的特性都学到了;
过拟合问题是机器学习面临的关键障碍,各类学习算法都必然带有一些针对过拟合的措施,但是过拟合问题是无法彻底避免的,只能减小其风险。

了解知识:

a.多项式时间:
我们所认为的有效的学习算法必然是在多项式时间内运行完成。(若是非多项式级的复杂,其计算的复杂度计算机往往不能承受,往往会超时,除非数据的规模非常小)

b.P问题、NP问题、NPC问题、NP难问题
一、P类问题:是指能在多项式时间内可解的问题。
二、NP问题:在多项式时间内“可验证”的问题。即最初的时候并不能判定这个问题有没有解,而是才出一个解在多项式时间内证明这个解是否正确,结果有可能正确也可能不正确。P类问题属于NP问题,但是NP问题不一定属于P类问题。
三、NPC问题:存在这样的一个NP问题,所有的NP问题都可以约话成它,即只要解决了这个问题,那么所有的NP问题都解决了,需要满足两个条件:(1)它是一个NP问题;(2)所有NP问题都能规约到它。
四、NP难问题:NP难问题满足NPC问题的第二个条件,但是不一定满足是一个NP问题。同样难以找到能够在多项式时间内解决问题的算法。

参考博客:P问题、NP问题、NPC问题、NP-hard问题详解

  • 0
    点赞
  • 6
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值