机器学习(Machine Learning, ML) 是指让机器具备学习能力的技术。具体而言,它是让机器找到能够将输入数据映射为输出结果的函数。例如,在语音识别中,机器学习可以帮助找到一个将声音信号转化为文字的函数。类似的,图像识别、围棋程序(如AlphaGo)也都依赖于找到适当的函数来实现相应的任务。
深度学习(Deep Learning, DL) 是机器学习的一个子领域,它利用多层神经网络来处理复杂的数据和任务。深度学习通过模拟人脑神经元的结构和功能,逐渐学习和提取数据中的层次特征,从而提高模型的预测和分类能力。
机器学习根据要解决的问题类型不同,主要分为以下几类:
- 回归(Regression): 当输出是一个数值或标量时,称为回归任务。例如,预测未来某一时刻的PM2.5数值。机器需要找一个函数,其输入为相关的环境指标,输出为预测的PM2.5数值。
- 分类(Classification): 当输出是一个类别时,称为分类任务。分类任务要求机器从预定义的选项中选择一个。例如,垃圾邮件检测系统可以判断邮件是否为垃圾邮件。分类任务的输出可以有多个选项,如围棋中的19×19个棋盘位置。
- 结构化学习(Structured Learning): 机器不只是选择一个类别或输出一个数值,而是生成一个有结构的结果,例如生成图像或撰写文章。
下面以视频的点击次数预测为例介绍下机器学习的运作过程:
1. 模型建立:
首先,假设需要预测一个视频频道在未来一天的总观看次数。我们可以设定一个函数:
y
=
b
+
w
×
x
1
y = b + w \times x_1
y=b+w×x1
其中,
y
y
y 是目标变量,即需要预测的观看次数;
x
1
x_1
x1 是已知特征,例如前一天的观看次数;
b
b
b 和
w
w
w 是未知参数,需要通过数据训练来确定。
2. 损失函数定义:
损失函数用于衡量预测结果与实际结果之间的差距。常见的损失函数包括平均绝对误差(MAE)和均方误差(MSE)。
例如,对于一天的预测误差可以计算为:
e
=
∣
y
−
y
^
∣
e = |y - \hat{y}|
e=∣y−y^∣
损失函数的最终目的是通过优化参数
b
b
b 和
w
w
w,使得整体预测误差最小。
3. 参数优化:
通过梯度下降法(Gradient Descent),可以不断调整参数
b
b
b和
w
w
w以最小化损失函数值。梯度下降法的核心在于计算损失函数对参数的导数,并沿着导数的反方向更新参数,以逐步逼近最优解。
在机器学习中,找到一个合适的模型和损失函数,并通过有效的优化方法来确定最佳参数,是实现高精度预测的关键。在实际应用中,模型的选择、特征的提取以及超参数的调整都会显著影响模型的表现。