TASK1《深度学习详解》- 1.1 通过案例了解机器学习
机器学习基础学习笔记
1. 基本概念
- 机器学习(ML): 让机器具备学习的能力,找到一个函数来解决问题。
- 深度学习(DL): 机器学习的一个子集,使用神经网络模拟人脑的学习方式。
- 回归(Regression): 输出是一个标量,如预测未来某个时间的PM2.5数值。
- 分类(Classification): 输出是一个类别,如垃圾邮件检测。
- 结构化学习(Structured Learning): 输出是一个有结构的物体,如机器生成一篇文章。
2. 案例学习: 视频点击次数预测
- 任务目标: 根据过往数据预测未来的观看次数。
- 过程步骤:
- 写出模型: 设定一个带有未知参数的函数(模型)来进行预测,例如
y = b + wx1
。y
: 预测的观看次数x1
: 前一天的观看次数w
: 权重b
: 偏置
- 定义损失函数: 衡量模型预测与真实值之间的差异。
- 常用损失函数:
- 平均绝对误差(MAE)
- 均方误差(MSE)
- 交叉熵(适用于概率分布)
- 常用损失函数:
- 优化问题: 使用梯度下降法找出使损失函数最小的参数
w
和b
。- 梯度下降: 通过反复计算损失函数的导数并调整参数,逐步逼近最优解。
- 写出模型: 设定一个带有未知参数的函数(模型)来进行预测,例如
3. 机器学习步骤详细解析
- 模型构建: 建立一个带有未知参数的函数,用于预测目标变量。
- 损失函数计算: 评估预测值与实际值之间的差异,决定模型的好坏。
- 参数优化: 使用优化算法如梯度下降,不断调整参数以最小化损失函数。
4. 梯度下降法详解
- 步骤:
- 随机初始化参数。
- 计算损失函数对参数的偏导数。
- 更新参数方向使得损失函数减小。
- 重复步骤2和3,直到满足停止条件。
- 挑战: 可能陷入局部最小值而非全局最小值,但实际应用中局部最小值问题并不显著。
5. 案例总结
- 实际应用: 使用历史观看次数数据,通过梯度下降找到最佳参数,模型误差小,预测准确性高。