常用机器学习算法汇总比较(上）

最新推荐文章于 2024-04-19 09:42:04 发布

spearhead_cai

最新推荐文章于 2024-04-19 09:42:04 发布

阅读量579

点赞数

分类专栏：机器学习算法如何构建一个完整的机器学习项目文章标签：机器学习逻辑回归决策树随机森林线性回归

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/lc013/article/details/87926483

版权

机器学习入门系列（2）–如何构建一个完整的机器学习项目，第七篇！

该系列的前六篇文章：

前面六篇文章从一个项目的终极目标、寻找和获取数据，到数据预处理，做特征工程，接下来就需要开始选择合适的算法模型，进行训练评估和测试了。

所以接下来会整理下比较常用的机器学习算法的汇总比较，包括：

线性回归
逻辑回归
决策树
随机森林
支持向量机
朴素贝叶斯
KNN 算法
K-均值算法
提升方法（Boosting）
GBDT
优化算法
卷积神经网络

因为篇幅问题，主要简单介绍每个算法的基本原理，优缺点等，以及为了保证每篇文章不会太长，可能会分成两篇或者三篇来介绍。

1. 线性回归

简述

定义：线性回归（Linear Regression）是利用称为线性回归方程的最小平方函数对一个或多个自变量和因变量之间关系进行建模的一种回归分析。

这种函数是一个或多个称为回归系数的模型参数的线性组合（自变量都是一次方）。只有一个自变量的情况称为简单回归，大于一个自变量情况的叫做多元回归。

线性回归的模型函数如下：
$h_\theta = \theta ^T x$

它的损失函数如下：
$J(\theta) = {1\over {2m}} \sum_{i=1}^m (h_\theta(x^{(i)}) - y^{(i)})^2$
通过训练数据集寻找参数的最优解，即求解可以得到 $minJ(\theta)$ 的参数向量 $\theta$ ,其中这里的参数向量也可以分为参数 $w 和 b$ , 分别表示权重和偏置值。

求解最优解的方法有最小二乘法和梯度下降法。

优缺点

优点：结果易于理解，计算上不复杂。
缺点：对非线性数据拟合不好。

最低0.47元/天解锁文章

关注

0
点赞
踩
3

收藏

觉得还不错? 一键收藏
打赏
0
评论
常用机器学习算法汇总比较(上）

机器学习入门系列（2）–如何构建一个完整的机器学习项目，第七篇！该系列的前六篇文章：机器学习入门系列(2)–如何构建一个完整的机器学习项目(一)机器学习数据集的获取和测试集的构建方法特征工程之数据预处理（上）特征工程之数据预处理（下）特征工程之特征缩放&amp;特征编码特征工程(完)前面六篇文章从一个项目的终极目标、寻找和获取数据，到数据预处理，做特征工程，接下来就需要开始选择...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

打赏作者

spearhead_cai 你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20

扫码支付：¥1

获取中

扫码支付

您的余额不足，请更换扫码支付或充值

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。