- 博客(4)
- 收藏
- 关注
原创 Transformer注意力机制【直观图文】
最近在学习Transformer这一深度学习模型架构,随手记录一下知识点,以防忘记,在阅读本篇文章前,读者需事先了解Transformer的基本结构和概念。本章将以图片的形式展示注意力机制中的具体细节,旨在帮助读者以更直观形象化的方式理解知识,图片以黑白为基调,需要读者耐心并关注需要关注的地方。
2025-04-06 11:47:53
2135
原创 Transfomer多头注意力机制中前馈神经网络的作用?
最近在学习Transformer这一深度学习模型架构,随手记录一下知识点,以防忘记,在阅读本篇文章前,读者需事先了解Transformer的基本结构和概念。在Transformer模型中,前馈神经网络(Feed-Forward Network, FFN)是每个编码器和解码器层的核心组件之一,并与多头注意力机制协同工作。它是通过非线性特征增强和位置独立的复杂模式学习来显著提升模型的表达能力。
2025-04-03 18:04:27
2555
原创 Transformer多头注意力机制中Q,K,V分别代表什么?
最近在学习Transformer这一深度学习模型架构,随手记录一下知识点,以防忘记,在阅读本篇文章前,读者需事先了解Transformer的基本结构和概念。
2025-04-02 15:07:24
2747
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人