一.机器学习简介

最新推荐文章于 2024-07-11 15:21:16 发布

梁小超

最新推荐文章于 2024-07-11 15:21:16 发布

阅读量512

点赞数 21

分类专栏：机器学习从0到1 文章标签：机器学习

本文链接：https://blog.csdn.net/u013867253/article/details/138201564

版权

机器学习从0到1 专栏收录该内容

11 篇文章 0 订阅

订阅专栏

1.1机器学习是什么

机器学习是实现人工智能应用的主要方法，它广泛的应用于机器视觉、语音识别、自然语言处理、数据挖掘等领域。

机器视觉（CV）：主要用计算机来模拟人的视觉功能，从客观事物的图像中提取信息，进行处理并加以理解，最终用于实际检测、测量和控制。例如图像识别。

语音识别：理解人说话的声音信号，将它转化成文字。例如语音转文字。

自然语言处理（NLP）：主要研究能实现人与计算机之间用自然语言进行有效通信的各种理论和方法。例如机器翻译、文本分类、问题回答。现在大火的大语言模型，比如ChatGPT的问答系统就属于NLP领域。

数据挖掘：指从大量的数据中通过算法搜索隐藏于其中信息的过程。例如数据归类、预测分析。

1.1.1关于机器学习一个简单的例子

有一个这样的问题：如何判断一个水果是樱桃还是猕猴桃？

人类可以瞬间给出问题的答案，但仔细思考一下我们来判断水果的时候主要看的是两种水果的特征，比较这两种水果的特征：猕猴桃比樱桃大、猕猴桃通常是绿灰色的而樱桃通常是红色的。

当我们用计算机来解决这个问题的时候也可以通过特征来进行判断。首先采集一些猕猴桃和樱桃，称它们为训练样本/样本数据，测量这些样本的质量和颜色，然后将水果放在二维坐标平面上，如图1.1所示。

图1.1

质量和颜色是区分两种水果的有用信息，组合在一起形成二维特征向量，这些特征向量可以转换成二维空间中的点，横坐标代表质量，纵坐标代表颜色。每测量一个水果就得到坐标中的一个点。我们把这些点绘制到二维坐标系中，得到如图1.2所示的结果，可以看到如果用一条直线把平面分成两部分，落在直线左上半部分的点判定为樱桃，落在直线右下部分的点判定为猕猴桃。

图1.2

我们的目标是要找到这条直线，假设它的方程为：

位于直线上方的所有点判定为樱桃，落在直线下方的点判定为猕猴桃，即满足如下不等式：

给两类水果进行编号，称为类别标签，定义樱桃的类别标签为-1，猕猴桃的类别标签为+1。上面的判定规则可以写成决策函数：

现在的问题是怎样找到这条直线，即确定参数a、b、c的值，保证水果能够被正确分类。通过样本数据寻找分类直线的过程就是机器学习的训练过程。由于要判断的是一个物体所属的类别，所以这个问题称为分类问题。预测水果类别的函数为：

sgn是符号函数，定义为：

机器学习算法中有很多都会用到符号函数。上面的例子中，需要用样本数据进行学习，得到一个函数（也可以称为模型），然后用这个模型对新的样本进行预测。可以得到图1.3所示的机器学习任务的一般流程。

图1.3

上面的过程是有监督学习的一般流程。机器学习算法通常需要大量的样本数据，是一种数据驱动的方法。

机器学习（Machine Learning，ML）是人工智能的分支和一种实现方法，它根据样本数据学习模型，用模型对数据进行预测与决策（也称为推理Inference）。机器学习让计算机算法具有类似人的学习能力，像人一样能够从实例中学到经验和知识，从而具备判断和预测的能力。

机器学习的本质是模型的选择以及模型参数的确定。也就是说机器学习算法是要确定一个映射函数 $f$ 以及函数的参数 $\theta$ ，建立如下映射关系：

其中，x为函数的输入值，一般是一个向量：

y为函数的输出值，是一个向量或者标量。当映射函数和它的参数确定之后，给定一个输入就可以产生一个输出。

映射函数 $f$ 没有特定的限制，上面水果分类的例子的映射函数是最简单的线性函数，也可以选择合适的非线性函数。

1.1.2机器学习的必要性

在20世纪80年代之前，人工智能技术解决各类问题的主流方法是逻辑推理、知识工程与专家系统，它们为人类的知识建立规则库，依靠规则库进行推断与决策以实现人工智能。以垃圾邮件过滤为例，其目标是确定一封邮件是否为垃圾邮件。如果使用人工规则的方法，通常是设定一些关键词，例如：发票、代开、代购、酒店、折扣、特价，它们是垃圾邮件中经常出现的词，如果一封邮件中出现这些关键词则认为是垃圾邮件。这种方法高度依赖于人类对具体问题的专业知识，而且通用性较差，人们需要对每个问题建立精细规则，对于复杂问题来说这是一件比较困难的事。

以图像识别为例，假如要判断一张图像是不是猫，最简单的做法的穷举，即列举图像所有可能的情况，然后建立一个规则库，将每种可能的图像标记为猫或者非猫。如果图像的长和宽都是512像素，图像是灰度的（每个像素点只有一个采样颜色），每个像素是0~255的整数。根据排列组合的原理，所有可能的图像数有：