机器学习
定义:如果某计算机程序在T任务中的性能(由P衡量)随着经验E的提高而提高,则可以说它是从经验E中学习有关某类任务T和性能度量P的。
简单的来说:
打个比方—>玩跳棋。
E =玩许多跳棋游戏的经验
T =扮演跳棋的任务。
P =程序将赢得下一场比赛的概率。
通常,可以将任何机器学习问题分配给以下两种广泛的分类之一:
监督学习和无监督学习。
监督学习
在监督学习中,我们得到了一个数据集,并且已经知道我们正确的输出应该是什么样子,并且认为输入和输出之间存在关系。
监督学习问题分为“回归”和“分类”问题。
在回归问题中,我们试图预测连续输出中的结果,这意味着我们试图将输入变量映射到某个连续函数。(根据之前的数据,预测一个准确的输出值。)
在分类问题中,我们改为尝试预测离散输出中的结果。换句话说,我们正在尝试将输入变量映射为离散类别。
例:
a)回归-给定一个人的照片,我们必须根据给定的照片来预测他们的年龄
b)分类-对于患有肿瘤的患者,我们必须预测肿瘤是恶性还是良性的。
无监督学习
无监督学习使我们几乎或根本不了解结果应该是什么样。我们可以从数据中获得结构,而不必知道变量的影响。
我们可以通过基于数据中变量之间的关系对数据进行聚类来推导此结构。
在无监督学习的情况下,没有基于预测结果的反馈。
定义一些字母意义
m = 训练样本的数目
x = 输入变量,特征量
y = 输出变量,目标变量(预测的结果)
机器学习运行原理![在这里插入图片描述](https://img-blog.csdnimg.cn/20201018025045148.png?x-oss-process=image/watermark,type_ZmFuZ3poZW5naGVpdGk,shadow_10,text_aHR0cHM6Ly9ibG9nLmNzZG4ubmV0L3FxXzM5NDQxMTEx,size_16,color_FFFFFF,t_70#pic_center)
为了更正式地描述监督学习问题,我们的目标是给定训练集,以学习函数h:X→Y,以便h(x)是y对应值的“良好”预测因子。由于历史原因,此函数h称为假设。如图所现。
代价函数
意义:如何把最有可能的直线与我们数据所拟合
梯度下降
α–是步长
这个是梯度下降的方向。