前言(主要符号表)
一.机器学习基础
机器学习(ML)
- 定义:机器学习是指让机器具备学习能力的技术。
- 核心:寻找一个函数,使机器能够完成各种复杂任务。
- 应用实例:语音识别:输入声音信号,输出对应的文字。图像识别:输入图片,输出图片中的内容。AlphaGo:输入棋盘上的棋子位置,输出下一步落子位置。
机械学习的分类
回归(Regression):
- 定义:当要找的函数输出是一个数值(标量)时,称为回归任务。
- 实例:预测未来PM2.5的数值,输入是各种与PM2.5相关的指数,输出是预测值。
分类(Classification):
- 定义:让机器从预设的选项中选择一个作为输出,这些选项称为类别(class)。
- 实例:邮件分类:检测邮件是否为垃圾邮件。多类别分类:不仅限于两个选项,可以有多个选项。
结构化学习:
- 定义:结构化学习要求机器不仅仅是做选择题或输出一个数字,而是需要产生一个具有结构的物体或输出。
1.1案例学习
以视频的点击次数预测为例,数据来源于视频平台后台的多种数据,包括每天点赞人数、订阅人数、观看次数等。
选择一个带有未知参数的函数来预测未来的观看次数。例如,使用线性模型 y = b + wx_1,其中 y是预测的观看次数,x_1是前一天的观看次数,b 和 w是待学习的未知参数。
模型理解:
b(偏置):用于调整预测值的基础偏移。
w(权重):表示前一天观看次数对当前预测值的影响程度。
定义损失:衡量模型预测值与实际值之间差异的函数。对于给定的模型,损失函数的输入是模型的参数,而输出则是一个标量值,表示当前参数设定下模型预测的好坏程度。
平均绝对误差:e=|y实-y预|
均方误差:e=(y实-y预)^2
误差表面:通过尝试不同的参数组合(如不同的w和b),计算每种组合下的损失,并将这些损失值在二维或高维空间中表示出来,形成的图形称为误差表面。
等高线图:
红色区域:表示损失较大,参数组合较差。
蓝色区域:表示损失较小,参数组合较优。
解最优化问题,找到使损失最小的参数值(w*, b*)。使用梯度下降(Gradient Descent)等优化算法进行参数更新。
梯度下降:
- 随机初始化参数:如 w0, b0。
- 计算梯度:计算损失函数对参数的偏导数(如 ∂L/∂w, ∂L/∂b)。
- 更新参数:根据梯度和学习率(η)更新参数值。
w1 = w0 - η * ∂L/∂w |w=w0
b1 = b0 - η * ∂L/∂b |b=b0
- 重复迭代:直到满足停止条件(如达到最大迭代次数或梯度接近0)。
局部最小值与全局最小值
局部最小值:在误差表面上的某个点,其周围点的损失都比它大,但不是全局最低点。
全局最小值:误差表面上的最低点,整个误差表面上的损失最小。