自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

weixin_66648504的博客

原创实验14.基于Transformer实现机器翻译（日译中）

我们定义了模型参数，初始化了模型，并实现了训练和评估的函数。通过准备数据、构建模型、训练和评估的过程，我们成功地训练了一个翻译模型。在本教程中，我们将使用Transformer模型，这是一种基于自注意力机制的深度神经网络模型，可以有效地处理序列到序列的翻译任务。我们首先定义模型的一些超参数，包括源语言和目标语言的词汇表大小、嵌入大小、多头注意力的头数、前馈网络隐藏层的大小和批处理大小。在准备完必要的类和函数后，我们就可以开始训练我们的模型了。我们定义了训练和评估函数，并使用它们来训练模型。

2024-06-29 16:00:06 1303

原创实验13：机器翻译

1. 编码器-解码器架构编码器-解码器架构是一种常用于序列到序列（sequence-to-sequence）任务的神经网络架构。在这个架构中，一个编码器将输入序列编码成一个固定长度的向量，而一个解码器则根据这个向量生成输出序列。

2024-06-29 15:12:52 1430

原创自然语言处理前馈网络学习总结

感知器是一种单层神经网络，它能够根据输入特征的线性组合来执行二分类任务。它的设计灵感来源于生物神经元的工作机制。每个输入都与一个权重相联系，代表该输入对输出决策的重要性。感知器的输出是通过将这些加权输入求和，并通过一个激活函数（通常是阶跃函数）来决定的。

2024-06-29 13:42:00 757

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示

确定要删除当前文章？

取消删除