机器学习工程师应当掌握的四大算法，你学会了吗？

最新推荐文章于 2021-07-19 17:30:13 发布

「已注销」

最新推荐文章于 2021-07-19 17:30:13 发布

阅读量906

点赞数

文章标签：人工智能机器学习算法

本文链接：https://blog.csdn.net/csdnvr/article/details/80130627

版权

原文：4 algorithms machine learning engineers should know
作者：Allerin
翻译：聂震坤
审校：苏宓

机器学习在过去几年取得了惊人的进步。机器学习算法旨在将人工智能与真实的人类智能无缝融合，提供最高水准的准确性和理解。

近年来，机器学习系统已经发展到模仿人类大脑模式进行思考的模式。开发机器学习的算法目的是教授计算机如何识别对象的特征。例如，像电脑展示一张猫的图片并告诉电脑这是一只猫，电脑会使用刚刚获得的各种信息来辨别猫的各种特征。刚开始，电脑会认为有四条腿和一条尾巴的东西都是猫，然而随着鹿的信息被插入进来，它可能更改认为猫是一种小体积的宠物动物。随着更多的动物被添加进来，这些特征会越来越准确，精确。多亏了这种机器学习算法，电脑才能够给每一个模型定义提供一个预测性的值，用来判定他对此物体的判别有多大把握。例如，黄色会增加对判定香蕉的把握值；绿色会提高对绿叶的判定值。

本文将会分享几种最常使用的机器学习算法。这些算法基本可以解决所有的数据问题。

机器学习算法1：线性回归

线性回归有助于基于连续变量估计实值。使用此算法，通过拟合最佳行来建立独立变量和因变量之间的关系，这个最合适的线被称为回归线。这个回归线是使用线性表达式，其中包括：

Y —— 因变量
a —— 斜率
X —— 自变量
B —— 截距

通过最小化数据点和回归线之间的距离的方差的和来导出系数a和b。

线性回归包括两种类型：简单线性回归和多线性回归。简单线性回归包括一个自变量，而多线性回归则由多个独立变量表现。

机器学习算法2：决策树

决策树是一种主要用于分类问题的监督学习算法。它可以用于分类和连续因变量。在该算法中，样本群被分为两个或多个均匀集合。这种分类是基于变量最重要的属性，以尽可能划分出更多更细的组。

机器学习算法3：SVM（支持向量机）

在本机器学习算法中，可以将每个数据项目绘制为n维空间中的一个点，并且每个要素的值由特定坐标的值表示。

例如，如果您只具有两个特征（如个体的身高和体重），则可以先在二维空间中绘制这两个变量。在这个二维空间中，每个点都有两个坐标，称为支持向量。接下来应该找到一条将数据分成两组不同分类的线，这条线是两组中最近点的最远距离。

机器学习算法4：朴素贝叶斯

这是基于贝叶斯定理的分类算法，假设预测器之间是独立的。简单来说，朴素贝叶斯分类器假设一个类中特定特征的存在与任何其他特征无关。例如一件物体如果是黄色，细长，长约6英寸，则可能被认为是香蕉。即使有些特征之间的联系很紧密，一个幼稚的贝叶斯分类器也将认为这些特征是独立的，并分别推测出此物品是香蕉的概率。

机器学习具有多种实际应用，有助于推动实际业务成果，包括节省时间和金钱。机器学习实施将对未来的企业产生巨大影响的潜力。上述算法将帮助您进行复杂的决策，从而提供正确的解决方案。

由中国人工智能学会、阿里巴巴集团 & 蚂蚁金服主办，CSDN、中国科学院自动化研究所承办的第三届中国人工智能大会（CCAI 2017）将于 7 月 22-23 日在杭州召开。作为中国国内高规格、规模空前的人工智能大会，本次大会由中国科学院院士、中国人工智能学会副理事长谭铁牛，阿里巴巴技术委员会主席王坚，香港科技大学计算机系主任、AAAI Fellow 杨强，蚂蚁金服副总裁、首席数据科学家漆远，南京大学教授、AAAI Fellow 周志华共同甄选出在人工智能领域本年度海内外最值得关注的学术与研发进展，汇聚了超过 40 位顶级人工智能专家，带来 9 场权威主题报告，以及“语言智能与应用论坛”、“智能金融论坛”、“人工智能科学与艺术论坛”、“人工智能青年论坛”4 大专题论坛，届时将有超过 2000 位人工智能专业人士参与。

目前，大会火热报名中，扫描下方图片中的二维码或直接点击链接火速抢票。