(1)引言
1 机器学习的要素:
无论什么类型的机器学习问题,都会遇到这些组件:
①数据:每个数据集遵循独立同分布。样本有时也叫做数据点或者数据实例,通常每个样本由一组称为特征的属性组成。当处理图像数据时,每一张单独的照片即为一个样本,它的特征由每个像素数值的有序列表表示
②模型:深度学习模型。机器学习模型这些的
③ 目标函数:。我们通常定义一个目标函数,并希望优化它到最低点。因为越低越好,所以这些函数有时被称为损失函数。但这只是一个惯例,我们也可以取一个新的函数,优化到它的最高点。这两个函数本质上是相同的,只是翻转一下符号。
④优化目标函数的算法:大多流行的优化算法通常基于一种基本方法–梯度下降(gradient descent)
2 各种机器学习问题分类
①监督学习:擅长在“给定输入特征”的情况下预测标签。每个“特征‐标签”对都称为一个样本
②回归:当标签取任意数值时,我们称之为回归问题,此时的目标是生成一个模型,使它的预测非常接近实际标签值。
③分类问题:应用程序能够自动理解从图像中看到的文本,并将手写字符映射到对应的已知字符之上
④标记问题:我们可能想让模型描绘输入图像的内容,一只猫、一只公鸡、一只狗,还有一头驴。学习预测不相互排斥的类别的问题称为多标签分类。举个例子,人们在技术博客上贴的标签,比如“机器学习”“技术”“小工具”“编程语言”“Linux”“云计算”“AWS”。一篇典型的文章可能会用5~10个标签
⑤搜索:而是在海量搜索结果中找到用户最需要的那部分。搜索结果的排序也十分重要,学习算法需要输出有序的元素子集
⑥推荐系统:目标是向特定用户进行“个性化”推荐。
⑦序列学习:如果输入的样本之间没有任何关系,以上模型可能完美无缺。但是如果输入是连续的,模型可能就需要拥有“记忆”功能。比如,处理视频片段,机器翻译,文本到语音
⑧无监督学习:,老板可能会给我们一大堆数据,然后要求用它做一些数据科学研究,却没有对结果有要求。这类数据中不含有“目标”的机器学习问题通常被为无监督学习
⑨强化学习:,智能体在一系列的时间步骤上与环境交互。在每个特定时间点,智能体从环境接收一些观察,并且必须选择一个动作,然后通过某种机制将其传输回环境,最后智能体从环境中获得奖励。强化学习框架的通用性十分强大。例如,我们可以将任何监督学习问题转化为强化学习问题。假设我们有一个分类问题,可以创建一个强化学习智能体,每个分类对应一个“动作”。