Datawhale X 李宏毅苹果书 AI夏令营 1.1通过案例了解机器学习

机器学习(Machine Learning, ML) 是指让机器具备学习能力的技术。具体而言,它是让机器找到能够将输入数据映射为输出结果的函数。例如,在语音识别中,机器学习可以帮助找到一个将声音信号转化为文字的函数。类似的,图像识别、围棋程序(如AlphaGo)也都依赖于找到适当的函数来实现相应的任务。

深度学习(Deep Learning, DL) 是机器学习的一个子领域,它利用多层神经网络来处理复杂的数据和任务。深度学习通过模拟人脑神经元的结构和功能,逐渐学习和提取数据中的层次特征,从而提高模型的预测和分类能力。

机器学习根据要解决的问题类型不同,主要分为以下几类:

  • 回归(Regression): 当输出是一个数值或标量时,称为回归任务。例如,预测未来某一时刻的PM2.5数值。机器需要找一个函数,其输入为相关的环境指标,输出为预测的PM2.5数值。
  • 分类(Classification): 当输出是一个类别时,称为分类任务。分类任务要求机器从预定义的选项中选择一个。例如,垃圾邮件检测系统可以判断邮件是否为垃圾邮件。分类任务的输出可以有多个选项,如围棋中的19×19个棋盘位置。
  • 结构化学习(Structured Learning): 机器不只是选择一个类别或输出一个数值,而是生成一个有结构的结果,例如生成图像或撰写文章。

下面以视频的点击次数预测为例介绍下机器学习的运作过程:

1. 模型建立:
首先,假设需要预测一个视频频道在未来一天的总观看次数。我们可以设定一个函数:
y = b + w × x 1 y = b + w \times x_1 y=b+w×x1
其中, y y y 是目标变量,即需要预测的观看次数; x 1 x_1 x1 是已知特征,例如前一天的观看次数; b b b w w w 是未知参数,需要通过数据训练来确定。

2. 损失函数定义:
损失函数用于衡量预测结果与实际结果之间的差距。常见的损失函数包括平均绝对误差(MAE)和均方误差(MSE)。
例如,对于一天的预测误差可以计算为:
e = ∣ y − y ^ ∣ e = |y - \hat{y}| e=yy^
损失函数的最终目的是通过优化参数 b b b w w w,使得整体预测误差最小。

3. 参数优化:
通过梯度下降法(Gradient Descent),可以不断调整参数 b b b w w w以最小化损失函数值。梯度下降法的核心在于计算损失函数对参数的导数,并沿着导数的反方向更新参数,以逐步逼近最优解。

在机器学习中,找到一个合适的模型和损失函数,并通过有效的优化方法来确定最佳参数,是实现高精度预测的关键。在实际应用中,模型的选择、特征的提取以及超参数的调整都会显著影响模型的表现。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值