Datawhale X 李宏毅苹果书 AI夏令营 Task01 通过案例了解机器学习

  • 机器学习和深度学习的基本概念

1.机器学习

(1)机器学习就是让机器具备找一个函数的能力。机器具备找函数的能力以后,它可以帮助人类做很多事。例如语音识别、图像识别等。

(2)要找的函数不同,机器学习就有不同的类别:

      ①回归(regression):假设要找的函数的输出是一个数值,一个标量(scalar),这种机器学习的任务称为回归。

      ②分类(classification):分类任务要让机器做选择题。人类先准备好一些选项,这些选项称为类别(class),现在要找的函数的输出就是从设定好的选项里面选择一个当作输出,该任务称为分类

      ③结构化学习:机器不只是要做选择题或输出一个数字,而是产生一个有结构的物体,比如让机器画一张图,写一篇文章。这种叫机器产生有结构的东西的问题称为结构化学习。

2.深度学习

深度学习是一种机器学习方法,它属于机器学习的分支。深度学习模仿人脑的工作原理,通过构建和训练多层神经网络来处理和解释复杂的数据,其核心组成部分是神经网络,由许多人工神经元组成,这些神经元通过学习算法来调整它们之间的连接权重。

  • 案例学习(以视频的点击次数预测为例)

  1. 案例情境:假设有人想要通过视频平台赚钱,他会在意频道有没有流量,这样他才会知道他的获利。假设后台可以看到很多相关的信息,比如:每天点赞的人数、订阅人数、观看次数。根据一个频道过往所有的信息可以预测明天的观看次数。找一个函数,该函数的输入是后台的信息,输出是隔天这个频道会有的总观看的次数。
  2. 步骤
  1. 步骤一:写出一个带有未知参数的函数 f,其能预测未来观看次数。
  2. 步骤二:定义损失(loss),损失也是一个函数。
  3. 步骤三:解一个最优化的问题。

     3. 专业名词

(1)模型:带有未知的参数(parameter)的函数称为模型(model)。

(2)损失函数:损失函数指的是在机器学习中用来衡量模型预测结果与实际结果之间差异的函数。其值越小,代表模型预测结果越接近实际结果。在训练模型时,需要通过不断调整模型参数来最小化损失函数的值。常见的损失函数包括均方误差、交叉熵等。

(3)训练数据:训练数据指的是用于机器学习算法训练的数据集合。这些数据集合通常包含已知的输入和对应的输出,而机器学习模型会基于这些数据来学习如何进行预测和决策。

(4)平均绝对误差:MAPE是一种常用的预测精度评估指标,又称平均绝对百分误差,用于衡量预测值与真实值之间的误差程度,以百分比的形式表示。MAE的计算公式为:将所有绝对误差的和除以样本量。

(5)均方误差:是一种评估模型预测结果与真实值之间误差大小的指标。它是指预测值与真实值之差的平方值的平均数。MSE越小,说明模型的预测结果越准确。它通常用于评估回归模型的性能。

(6)交叉熵:是Shannon信息论中一个重要概念,主要用于度量两个概率分布间的差异性信息。 交叉熵量化两个概率分布之间的区别,用于度量两个概率分布间的差异性信息。语言模型的性能也通常用交叉熵和复杂度来衡量,将交叉熵引入计算语言学消歧领域。

(7)学习率:学习率是机器学习算法中的一个参数,用来控制模型在每次迭代中对数据学习的速率。它表示模型每次更新参数时改变的量的大小。

       在本次夏令营中第一次接触到机器学习和深度学习的知识,通过提供的文字教程和视频教程,我学习了解了什么是机器学习。在给出的文字教程中,通过一个具体的案例,向我们解释了机器学习找函数的过程,让我对机器学习有了进一步的了解,期待在之后的学习中能学到更多有关深度学习的内容。

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值