TensorFlow之文本分类算法-6

最新推荐文章于 2024-05-14 02:34:55 发布

wangys2006

最新推荐文章于 2024-05-14 02:34:55 发布

阅读量845

点赞数 3

分类专栏：人工智能技术与架构文章标签： tensorflow 分类

本文链接：https://blog.csdn.net/uesowys/article/details/128160894

版权

人工智能技术与架构专栏收录该内容

29 篇文章 3 订阅

订阅专栏

1 前言

2 收集数据

3 探索数据

4 选择模型

5 准备数据

6 模型-构建训练评估

构建输出层

构建n-gram模型

构建序列模型

GloVe（英文全称是Global Vectors for Word Representation）是一个全球化的英语语境的单词表示的向量集，其使用非监督类型的机器学习算法生成（GloVe在后续章节中详细描述）。

IMDb数据集合与GloVe数据集合的来源不一样，因此，机器学习过程需要进行一些上下文环境的优化与调整才能在不同向量空间中实行相互融合，其调整步骤如下所示：

步骤1：

在第一次运行机器学习的过程中，先不使用嵌入层的向量空间参与学习，也就是，保持权重不变，其他层保持正常学习，在第一次运行机器学习过程中，让权重这些初始值先达到一个比较好的状态，在第二次运行机器学习的过程中，使用嵌入层的向量空间参与到整个神经网络的学习，第二次运行机器学习对整个神经网络的权重进行较好的调整，该过程被称之嵌入层的微调（小幅度的调优）。

步骤2：

步骤1的嵌入层的微调能够取得更好的准确度，但是该过程也大幅度地消耗更多的计算资源。实践证明，只要学习的样本足够多，使用其他的机器学习方式也能取得与嵌入层微调相同的准确度，其他机器学习方式能大幅度地降低计算资源的消耗。

监督型机器学习

监督型机器学习模型训练的数据包括两个部分，特征数据集（问题）以及每个特征对应的标签数据集（答案），该学习方式类似于从一系列的问题以及问题对应的答案中学习，通过机器学习之后，系统掌握了问题与答案之间的映射关系，并将这些问题与答案进行归类为某一个主题，当系统接收到全新的问题的时候，则从这些主题中寻找答案。

非监督型机器学习

非监督型机器学习模型训练的数据只包括一个部分，特征数据集，其学习的目的是从这些未被标签化的特征数据集中进行归类（聚类）于类似的分组。例如，对不同属性的音乐进行分类，然后，将分类所得的音乐集合推送给用户（推荐服务）。

半监督型机器学习

半监督型机器学习模型的数据包括两个部分，特征数据集以及一部分特征数据集对应的标签数据集，由于标签不全，需要通过机器学习推断其他未被标签化的特征数据集，标签推断完成之后，再进行全面的监督型机器学习。

实践证明，通过对比不同的序列化机器学习模型（CNN, sepCNN, RNN (LSTM & GRU), CNN-RNN），sepCNN（在后续章节中详细描述）模型是效率最高的模型，其学习表现比其他模型更加优秀，sepCNN模型（四层）的代码如下所示：

训练模型

训练模型是对前面章节中构建的模型进行训练，训练涉及到的步骤是根据模型的当前状态做出预测，计算预测的准确率，根据预测的准确率更新以及调整神经网络中的权重、参数，从而最小化模型预测的错误，最终使得构建的模型的预测更加准确，训练过程中不断重复这些预测与分析的过程，直到模型达到收敛的效果而结束训练模型的过程，该过程涉及到三个关键参数如下所示：

统计数据（Metric），用于测量模型的表现的优秀程度，在机器学习中使用准确度作为统计数据。
损失函数（Loss function），用于计算一个训练过程中的损失值，然后，调整神经网络的权重，最终，让损失值最小化，对于分类问题，使用交叉熵（cross-entropy）损失函数最适合。
优化器（Optimizer），该函数用于根据损失函数的输出确定如何更新神经网络的权重，例如，Adam优化方法（在后续章节中详细描述）。

这些参数的对照信息如下所示：

如上所示，learning parameter是学习参数类型，Value是学习参数对应的名称。

在训练流程中，主要使用模型的fit函数，根据训练数据集的规模，训练的大部分计算时间都消耗在fit函数中。在训练过程的每次迭代中，从训练数据集中提取batch_size大小的数据样本进行训练，在该次迭代中，使用损失函数计算损失值，根据损失值更新神经网络中的权重值。在训练过程中，经过多次的迭代，训练数据集已经根据batch_size大小处理了所有的批次，则该次训练过程完成，该过程被称之为一次epoch。在每次epoch完成时，使用测试数据集验证该次epoch的训练效果如何，经过多次epoch的训练，验证的训练效果的准确度达标以及准确度达到稳定的状态，则停止训练。训练的超级参数如下所示：