自然语言处理（NLP）—— 神经网络语言处理

思诺学长-刘竞泽

已于 2024-11-02 00:38:28 修改

阅读量2.8k

点赞数 20

分类专栏： NLP自然语言处理文章标签：自然语言处理神经网络人工智能

于 2024-06-02 22:19:32 首次发布

本文链接：https://blog.csdn.net/weixin_65190179/article/details/136639799

版权

1. 总体原则

1.1 深度神经网络（Deep Neural Network）的训练过程

下图展示了自然语言处理（NLP）领域内使用的深度神经网络（Deep Neural Network）的训练过程的简化图。

在神经网络的NLP领域：

语料库（Corpora of Human Utterances）：这是神经网络训练的起点，包含了大量的人类语言数据。这些数据可以是文本或者是语音形式，用于让机器学习语言的模式。

深度神经网络（Deep Neural Network）：这个框代表了一个或多个层次的神经网络，它通过学习语料库中的模式来进行训练。网络的每一层都会提取数据中的不同特征，并逐渐形成复杂的表示。

实际输出（Actual Outcomes）：网络在处理输入数据后得到的结果。这些结果是模型当前学习状态的直接产物。

期望输出（Desired Outcomes）：这些是在训练过程中用于指导网络训练方向的标签或结果。通过比较实际输出与期望输出，网络可以调整其内部参数。

定量评估、损失函数（Quantitative evaluation, loss function）：损失函数是用来衡量实际输出与期望输出之间差异的一个指标。通过最小化损失函数，网络可以优化其参数以更好地进行预测。

在神经NLP哲学中，这种方法完全符合经验主义范式。这意味着，系统完全基于数据来学习语言，而不是基于预设的关于语言如何工作的规则。这是一种归纳的方法：系统分析大量的语料库，并且知道它需要预测什么，但是不被告知如何获得预测结果。初始时，网络对自然语言一无所知，也没有内置关于语言工作方式的假设——至少在理论上是这样。这种方法使得网络能够学习各种语言现象，而不受限于人类语言学家的先入为主的假设。