- 博客(2)
- 收藏
- 关注
原创 基于Transformer实现机器翻译
机器翻译是指将一段文本从一种语言自动翻译到另一种语言。因为一段文本序列在不同语言中的长度不一定相同,所以我们使用机器翻译为例来介绍编码器—解码器和注意力机制的应用。
2024-06-26 09:53:09
1127
原创 使用前馈神经网络进行姓氏分类
最简单的MLP,如图1所示,由三个表示阶段和两个线性层组成。第一阶段是输入向量。这是给定给模型的向量。给定输入向量,第一个线性层计算一个隐藏向量——表示的第二阶段。隐藏向量之所以这样被调用,是因为它是位于输入和输出之间的层的输出。使用这个隐藏的向量,第二个线性层计算一个输出向量。输出向量是类数量的大小。图1 一种具有两个线性层和三个表示阶段(输入向量、隐藏向量和输出向量)的MLP的可视化表示多层感知器能够解决非线性问题的关键在于其包含一个或多个隐藏层。
2024-06-14 19:13:52
1006
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人