天下没有白吃的午餐——机器学习算法选择(带图)

本文介绍了机器学习中NFL和PAC理论,强调算法选择需考虑应用场景。探讨了回归(如SGD、Lasso、岭回归、弹性网络)和分类(如逻辑回归、SVM)方法,并提及聚类(DBSCAN、VBGMM、GMM)与降维(LLE、ISOMAP)技术。强调在实际应用中应注重数据和场景的匹配,而非盲目追求算法复杂性。
摘要由CSDN通过智能技术生成
欢迎关注,敬请点赞!

天下没有白吃的午餐——机器学习算法选择

机器学习算法两个重要的概念

  1. 天下没有白吃的午餐NFL(No Free Lunch):没有一个学习算法可以在任何领域总是产生最准确的学习器。
  2. 概率近似正确PAC(Probably Approximately Correct):当训练样本足够大时,“训练准确率”与“预测准确率”的差值,超出容忍误差范围的概率非常小。当模型在训练样本表现很好时,就可以十分有把握地认为它在“预测未来”时,表现一样好。

机器学习算法导图

上述算法没有优劣之分,都仅适合特定的场景(选择时Try & Test)。对于机器学习、人工智能以及大数据行业来说,不要过于迷信!

  1. 封闭可控的场景
  2. 辅助增强而不是替代人
  3. 巧妙利用数据而不是等待大数据
  4. 容错机制而不过于依赖算法

回归

  • 随机梯度下降SGD(Stochastic Gradient Decent),当数据量特别大时,加快计算速度
  • Lasso回归(L1范数),会将不重要特征前的系数变为0,即忽略不重要特征。用于稀疏特征,和PCA降维作用差不多(原理不同)。

正 则 化 时 , 采 用 绝 对 值 : l o s s ( f ) + λ ∣ w ∣ 正则化时,采用绝对值:loss(f) + \lambda |w|

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值