1. 基本概念
1. 机器学习(Machine Learning, ML):是指让计算机系统通过数据学习执行特定任务的能力。
2. 深度学习(Deep Learning, DL):是机器学习的一个分支,它利用多层神经网络解决复杂问题。
3. 机器学习任务
(1) 回归(Regression):预测连续数值,例如预测未来的PM2.5指数。
(2) 分类(Classification):从给定的类别中选择一项作为输出,例如检测邮件是否为垃圾邮件。
(3) 结构化学习(Structured Learning):生成具有结构的输出,如图像或文章。
2. 案例学习:预测视频点击次数
机器学习找函数的过程,分成 3 个步骤:
1. 模型构建:
(1) 目标: 预测明天的观看次数。
(2) 模型: 建立一个带有未知参数的模型,用于预测视频的未来点击次数。模型形式为 y=b+wx1
,其中 y
是预测的观看次数,x1
是前一天的实际观看次数,b
和 w
是待求解的未知参数。
2. 定义损失:
(1) 损失函数: 用来评估模型预测的准确性。设计一个损失函数 L(b, w)
来衡量模型预测的准确性。损失函数的目的是评估模型参数的好坏。
(2)计算损失: 使用训练数据集来计算损失。训练数据集包含过去几年的观看次数记录。
3. 优化求解:使用梯度下降法等方法找到使损失函数最小化的参数值 b*
和 w*
。梯度下降法涉及迭代更新参数,直到达到某个停止条件。
(1) 误差表面: 通过尝试不同的 b
和 w
组合,计算每组参数下的损失值,从而构建一个误差表面。
(2) 梯度下降法:梯度下降是一种常用的优化方法,通过梯度下降法来寻找最小化损失的参数值 b*
和 w*
。
① 初始化:随机选择初始参数值。
② 计算梯度:计算损失函数关于每个参数的梯度。
③ 更新参数:按梯度方向更新参数,更新步长由学习率决定。
④ 停止条件:达到预设的最大迭代次数或者梯度接近于零。
(3) 局部最小值问题:在某些情况下,梯度下降法可能会陷入局部最小值而非全局最小值,导致未能找到最优解。
总结:
通过这个案例学习,了解到机器学习的基本步骤包括构建模型、定义损失函数以及使用优化算法来最小化损失。
未完待续...