6.24周报

最新推荐文章于 2024-09-28 21:53:47 发布

刘建国(小小怪将军)

最新推荐文章于 2024-09-28 21:53:47 发布

阅读量624

点赞数 16

文章标签：机器学习

本文链接：https://blog.csdn.net/DoraLYH/article/details/139940840

版权

本周进度

一、AI学科关系

上世纪八十年代末,人工神经网络的反向传播算法的发明使得机器学习重新回到学者的视野,引发了基于反向传播算法的机器学习领域的探讨,直到现在。深度学习是一种机器学习的子领域，它关注如何使用大规模数据来训练复杂模型以解决各种任务。神经网络是深度学习中的核心组件之一，它们是通过模仿人类神经系统的结构和功能而设计的复杂数学模型。在深度学习中，神经网络通常被用来解决如语音和图像识别、自然语言处理等问题。它们通过层层传递和处理数据，逐渐提取出数据中的高级特征，并根据这些特征做出决策或预测。深度学习模型往往依赖于大量的标记数据来进行训练，这一过程中会调整网络参数，以达到最小化预测误差的目的。

图 1.1 AI学科关系

循环神经网络（RNN）是一种特殊类型的人工神经网络，特别适用于处理具有序列依赖性的数据，如文本、时间序列等。RNN的设计灵感来源于人类大脑的神经网络，它具有记忆能力，可以利用先前的信息来影响后续的输出。RNN（循环神经网络）的设计核心在于其结构中的循环连接，这一机制允许信息在网络内部进行循环传递，从而捕捉序列数据中元素之间的依赖关系。这个循环连接允许网络在处理序列数据时保留记忆，并在每个时间步上接收新的输入并产生输出。初始输⼊数据xt 在隐藏层神经元计算后得到隐藏状态 ,在下一个时间步t,隐藏层神经元不仅接收时间步t的输⼊数据,还会接收时间步t 输出的隐藏状态，得到新的隐藏状态。

基于这些输入，RNN会计算出当前时间步的隐藏状态ht 和输出y 。从数学的角度来看，RNN的隐藏状态ht 和输出yt 可以通过以下公式迭代地计算得出：

其中，f和g是激活函数（比如sigmoid、tanh或ReLU），Wih 是输入权重矩阵，Whh 是隐藏层到隐藏层的权重矩阵，Why 是隐藏层到输出的权重矩阵，bh 和by 分别是隐藏层和输出的偏置项。这些权重和偏置项在训练过程中被学习并更新，以优化网络对输入数据的处理。其结构如图1.2所示。

图1.2 RNN结构

能够处理任意长度的序列输入时RNN（循环神经网络）的一个显著特性。更详细的过程就是，RNN在处理序列的每个时间步时都使用相同的权重参数，即参数共享，这种特性让其能够无障碍地应用于不同长度的输入序列，无需针对每个特定长度的序列重新训练模型。通过这种方式，RNN能够有效地学习并捕捉序列数据中的内在结构和模式，在各种序列处理任务中展现出强大的性能。