六、机器学习基础

最新推荐文章于 2024-09-13 11:18:00 发布

xlw_0579

最新推荐文章于 2024-09-13 11:18:00 发布

阅读量434

点赞数 10

分类专栏： Keras 文章标签：机器学习人工智能

本文链接：https://blog.csdn.net/xlw_6569/article/details/136174081

版权

Keras 专栏收录该内容

16 篇文章 1 订阅

订阅专栏

监督学习

给定一组样本（通常由人工标注），它可以学会将输入数据映射到已知目标［也叫标注（annotation）］。
监督学习主要包括分类和回归，但还有更多的奇特变体。
在这里插入图片描述

无监督学习

无监督学习是指在没有目标的情况下寻找输入数据的有趣变换，其目的在于数据可视化、数据压缩、数据去噪或更好地理解数据中的相关性。无监督学习是数据分析的必备技能，在解决监督学习问题之前，为了更好地了解数据集，它通常是一个必要步骤。降维（dimensionality reduction）和聚类（clustering）都是众所周知的无监督学习方法。

自监督学习

自监督学习是没有人工标注的标签的监督学习，你可以将它看作没有人类参与的监督学习。标签仍然存在（因为总要有什么东西来监督学习过程），但它们是从输入数据中生成的，通常是使用启发式算法生成的。

强化学习

智能体（agent）接收有关其环境的信息，并学会选择使某种奖励最大化的行动。

分类和回归术语表

在这里插入图片描述

训练集、验证集和测试集

评估模型的重点是将数据划分为三个集合：训练集、验证集和测试集。在训练数据上训练模型，在验证数据上评估模型。一旦找到了最佳参数，就在测试数据上最后测试一次。
三种经典的评估方法：简单的留出验证、K 折验证，以及带有打乱数据的重复 K 折验证。
在这里插入图片描述

在每次将数据划分为 K 个分区之前都先将数据打乱。最终分数是每次 K 折验证分数的平均值。注意，这种方法一共要训练和评估 P×K 个模型（P是重复次数），计算代价很大。

数据预处理

向量化
神经网络的所有输入和目标都必须是浮点数张量
值标准化
在手写数字分类的例子中，开始时图像数据被编码为 0~255 范围内的整数，表示灰度值。
将这一数据输入网络之前，你需要将其转换为 float32 格式并除以 255，这样就得到 0~1 范围内的浮点数。
处理缺失值
将缺失值设置为 0 是安全的

特征工程

特征工程（feature engineering）是指将数据输入模型之前，利用你自己关于数据和机器学习算法（这里指神经网络）的知识对数据进行硬编码的变换（不是模型学到的），以改善模型的效果。
我们来看一个直观的例子。假设你想开发一个模型，输入一个时钟图像，模型能够输出对应的时间。
在这里插入图片描述

过拟合与欠拟合

优化（optimization）是指调节模型以在训练数据上得到最佳性能
泛化（generalization）是指训练好的模型在前所未见的数据上的性能好坏

训练开始时，优化和泛化是相关的：训练数据上的损失越小，测试数据上的损失也越小。这时的模型是欠拟合（underfit）的，即仍有改进的空间，网络还没有对训练数据中所有相关模式建模。但在训练数据上迭代一定次数之后，泛化不再提高，验证指标先是不变，然后开始变差，即模型开始过拟合。这时模型开始学习仅和训练数据有关的模式，但这种模式对新数据来说是错误的或无关紧要的。

降低过拟合的方法叫作正则化
防止过拟合的最简单的方法就是减小模型大小，即减少模型中可学习参数的个数（这由层数和每层的单元个数决定）。

权重正则化（weight regularization），其实现方法是向网络损失函数中添加与较大权重值相关的成本（cost）。
这个成本有两种形式。

L1 正则化（L1 regularization）：添加的成本与权重系数的绝对值［权重的 L1 范数（norm）］成正比。
L2 正则化（L2 regularization）：添加的成本与权重系数的平方（权重的 L2 范数）成正比。神经网络的 L2
正则化也叫权重衰减（weightdecay）。不要被不同的名称搞混，权重衰减与 L2 正则化在数学上是完全相同的。

from keras import regularizers
model = models.Sequential()
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
 activation='relu', input_shape=(10000,)))
model.add(layers.Dense(16, kernel_regularizer=regularizers.l2(0.001),
 activation='relu'))
model.add(layers.Dense(1, activation='sigmoid'))

dropout 正则化
对某一层使用 dropout，就是在训练过程中随机将该层的一些输出特征舍弃（设置为 0）

model = models.Sequential()
model.add(layers.Dense(16, activation='relu', input_shape=(10000,)))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(16, activation='relu'))
model.add(layers.Dropout(0.5))
model.add(layers.Dense(1, activation='sigmoid'))