【Datawhale AI 夏令营第五期学习笔记】Datawhale X 李宏毅苹果书深度学习入门 AI夏令营 Task1 #Datawhale #AI夏令营-CSDN博客

本文链接：https://blog.csdn.net/2301_80126721/article/details/141559766

第一章机器学习基础

机器学习（Machine Learning，ML） 指的是赋予机器学习能力的技术。具体来说，机器学习的核心任务是让机器找到某种函数。这一函数的求解过程，通常难以通过人工编写，但可以通过机器学习的方法进行自动化获取。以下是几个典型的应用场景：

深度学习（Deep Learning，DL） 是机器学习的一个分支，专注于通过多层神经网络来解决复杂问题。它的核心思想仍然是函数的求解，但通过深度网络的特性，能够更有效地处理大规模数据和复杂任务。

回归任务 的目标是找到一个函数，使其输出为数值型结果（标量）。例如，预测未来某一时刻的 PM2.5 值，输入可以包括当前的 PM2.5 数据、平均温度、臭氧浓度等相关指数，输出则是预测的 PM2.5 数值。

分类任务 要求机器在给定选项（类别）中选择一个最合适的输出。例如：

结构化学习 任务超越了简单的分类或回归，目标是生成具有复杂结构的输出。例如：

此类任务涉及生成具有内部结构的复杂输出，是机器学习中更高级的应用。

机器学习的核心在于函数的求解，不同任务（如回归、分类和结构化学习）对应于不同的函数输出形式。深度学习则利用多层神经网络进一步优化这一过程，解决更为复杂的实际问题。

假设一个人希望通过视频平台赚取收入，他会关注频道的流量情况，以了解获利情况。可以利用视频后台的各种数据（如每天的点赞人数、订阅人数、观看次数等）来预测明天的观看次数。为此，需要找到一个函数，该函数以这些后台信息作为输入，并输出明天该频道的总观看次数。

机器学习的第一步是定义一个带有未知参数的函数 ( f )，用于预测未来的观看次数。例如，假设将函数写成：

$\times x_1$

其中：

在这里：

这个带有未知参数的函数被称为模型（model）。( x_1 ) 是已知的特征（feature），而 ( w ) 和 ( b ) 是需要通过数据找到的未知参数。

损失函数是一个用于衡量模型性能的函数，通常表示为 ( L(b, w) )，其中输入为模型参数 ( b ) 和 ( w )，输出则表示模型的误差。

例如，假设 ( b = 500 )，( w = 1 )，则预测函数变为：

$\hat{y} = 500 + x_1$

然后，利用历史数据（如从 2017 年 1 月 1 日到 2020 年 12 月 31 日的观看次数）来计算损失。

举例：

通过计算每一天的预测误差 ( e )，可以得到一个损失函数 ( L )：

$\frac{1}{N} \sum_{n} e_n$

其中，( N ) 是训练数据的总数。常见的误差计算方法有：

可以通过调整 ( w ) 和 ( b ) 的值，计算它们对应的损失，从而绘制出等高线图（误差表面）.

接下来，需要解一个最优化问题，即找到最优的 ( w ) 和 ( b )，使得损失函数 ( L ) 最小。通常使用梯度下降法（gradient descent）进行优化。

梯度下降的基本思想是：

随机选择一个初始点 ( w_0 )。
计算损失函数对 ( w ) 的导数 $\frac{\partial L}{\partial w} \Big|_{w=w_0}$
根据导数的符号，更新 ( w ) 的值： $w_1 = w_0 - \eta \frac{\partial L}{\partial w}$ ，其中 $\eta$ 是学习率（learning rate）。