机器学习算法概述

最新推荐文章于 2024-08-25 14:45:16 发布

uuddoop

最新推荐文章于 2024-08-25 14:45:16 发布

阅读量779

点赞数

分类专栏：机器学习文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/u010811683/article/details/130011489

版权

本文介绍了机器学习的基础知识，包括监督学习、无监督学习、半监督学习和强化学习的定义和区别。接着详细讲解了各种机器学习算法，如回归算法（线性回归、非线性回归、逻辑回归）、聚类（基于层次、分割、密度和网格的聚类）、分类（逻辑回归、朴素贝叶斯、SVM、KNN、决策树、随机森林）以及降维和时间序列分析。此外，还讨论了深度学习中的神经网络、反向传播、前馈神经网络、卷积神经网络、循环神经网络和递归神经网络。最后总结了选择合适机器学习算法的考量因素。

摘要由CSDN通过智能技术生成

机器学习概述

01 监督学习

02 无监督学习：

03 半监督学习

04 强化学习

机器学习算法介绍

1 回归算法

01线性回归：

02非线性回归

03逻辑回归

2 聚类

01基于层次的聚类

02基于分割（划分）的聚类

03基于密度的聚类

04基于网格的聚类

05基于模型的聚类

3分类：

01 逻辑回归

02 朴素贝叶斯分类器

03 SVM算法：

04 KNN

05 决策树：

06 随机森林

4降维

有监督降维

无监督降维

5 时间序列：

常用算法：AR、MA、ARMA、ARIMA、SARIMA

Prophet模型

LSTM

6深度学习：

01神经网络：

02反向传播：

03前向神经网络（Feedforward Neural Networks, FNN）：

04卷积神经网络（Convolutional Neural Networks, CNN）

05循环神经网络（Recurrent Neural Networks ,RNN)

06递归神经网络（Recursive Neural Network ）

总结

机器学习概述

机器学习是指机器通过统计学算法，对大量历史数据进行学习，进而利用生成的经验模型指导业务。它是一门多领域交叉学科，专门研究计算机怎样模拟或实现人类的学习行为，以获取新的知识或技能，重新组织已有的知识结构使之不断改善自身的性能。

01 监督学习

监督学习是根据已有数据集，知道输入和输出结果之间的关系，然后根据这种已知关系训练得到一个最优模型。也就是说，在监督学习中，我们的训练数据应该既有特征又有标签，然后通过训练，使得机器能自己找到特征和标签之间的联系，然后在面对没有标签的数据时可以判断出标签。

主要分为：分类任务、回归任务、序列标注任务。

监督学习实例：iris数据集是用来给花做分类的数据集，每个样本包含了花萼长度、花萼宽度、花瓣长度、花瓣宽度四个特征（前4列），我们需要建立一个分类器，分类器可以通过样本的四个特征来判断样本属于山鸢尾、变色鸢尾还是维吉尼亚鸢尾（这三个名词都是花的品种）。

02 无监督学习：

无监督学习和监督学习最大的不同是监督学习中数据是带有一系列标签。在无监督学习中，我们需要用某种算法去训练无标签的训练集从而能让我们我们找到这组数据的潜在结构。无监督学习大致可以分为聚类和降维两大类。

主要分为：聚类任务、降维任务

有监督学习方法必须要有训练集与测试样本。在训练集中找规律，而对测试样本使用这种规律。而非监督学习没有训练集，只有一组数据，在该组数据集内寻找规律，比如右图实例，可用过聚类算法自动给数据集分类。

03 半监督学习

半监督学习是监督学习和无监督学习相互结合的一种学习方法，通过半监督学习的方法可以实现分类、回归、聚类的结合使用。

半监督分类：是在无类标签的样例的帮助下训练有类标签的样本，获得比只用有类标签的样本训练得到更优的分类；半监督回归：在无输出的输入的帮助下训练有输出的输入，获得比只用有输出的输入训练得到的回归器性能更好的回归；半监督聚类：在有类标签的样本的信息帮助下获得比只用无类标签的样例得到的结果更好的簇，提高聚类方法的精度；半监督降维：在有类标签的样本的信息帮助下找到高维输入数据的低维结构，同时保持原始高维数据和成对约束的结构不变。半监督学习是最近比较流行的方法。

04 强化学习

强化学习是一种比较复杂的机器学习方法，强调系统与外界不断的交互反馈，它主要是针对流程中不断需要推理的场景，比如无人汽车驾驶，它更多关注性能。它是机器学习中的热点学习方法。

机器学习算法介绍

常用的机器学习算法：

1 回归算法

回归分析是一种统计分析方法，用于预测一个连续变量与一个或多个其他变量之间的关系。回归分析通过建立模型来预测因变量（被预测变量）与自变量（预测变量）之间的关系，从而预测因变量的值。回归分析有多种形式，包括线性回归、非线性回归、Logistic回归等。

01线性回归：

线性回归：是回归分析的一种，假设因变量与自变量之间存在线性关系，即因变量与自变量的关系可以用一条直线来描述。它最常见的应用场景是预测数值型变量，如预测房价根据面积、房龄等因素。