不同分类算法的优缺点是什么？

最新推荐文章于 2024-05-22 14:03:04 发布

一只小Kevin

最新推荐文章于 2024-05-22 14:03:04 发布

阅读量2w

点赞数 1

分类专栏：学术文章标签：算法机器学习

目录

1不同分类算法的优点是什么-Xavier Amatriain版

//声明：翻译：https://www.quora.com/What-are-the-advantages-of-different-classification-algorithms 中Xavier Amatriain 对问题“What are the advantages of different classification algorithms?”的回答

你可以从下面几个方面来看你要选择哪个算法比较合适：

训练样本的数量
特征空间的维数
我是否期望问题是【线性可分离】的吗？（线性可分离就是指不同类问题在图中用直线能完全分开）
特征是否是独立的
希望特征与目标变量是【线性可分离】的吗？
过度拟合是否将成为一个问题？
系统在速度、性能、内存占用方面有什么需求？

…

不管上述有多复杂，我们要只要遵循奥卡姆的剃刀原则（Razor principle）：如无必要，勿增实体。

逻辑回归：

通常，我推荐先用逻辑回归。逻辑回归是一种具有很好表现的分类算法，只要你的【特征】是线性或近似线性的并且【问题】是线性可分的就可以用它进行训练。你可以通过【特征工程】将大多数非线性特征简单的转化成较好的线性的特征。它抗噪声干扰能力强，并且你可以通过使用l2和l1正则化的方法来对特征进行选择从而避免过度拟合。逻辑回归也可以用在大数据的场景中，因为它是非常有效并且可以分布式的使用，如，ADMM（logreg）。逻辑回归LR最大的优点就是它的输出的是几率，更容易解释，这样还可以直接拿来用，例如，用排行来代替分类。

即使你认为逻辑回归方法不能十分的有效，那也请你使用一个简单的l2-regularized LR来试一下。

好了，那么假设你已经了解了并简单使用了LR，下一步该做什么？我主要推荐两个合适的方向:1.SVM 2.决策树集。如果我不知道你要分类的问题，那我肯定会使用决策树集成的方法，但是我会先从描述SVM开始讲为什么SVM会是一个值得考虑的方法。

PS：csdn上一个感觉不错的逻辑回归的介绍

支持向量机SVM：

Support Vector Machines (SVMs) 使用与LR不同的损失函数（Hinge）。他们的解释也不相同（最大间距&#x

最低0.47元/天解锁文章

关注

1
点赞
踩
20

收藏

觉得还不错? 一键收藏
1
评论
不同分类算法的优缺点是什么？

本文从外网上摘取了几个不错的关于介绍在机器学习中不同分类方法的文章并翻译，用于记录、学习和分享。水平有限，如果文中有错误之处希望能得到大家的指正。
复制链接

扫一扫

专栏目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。