- 博客(3)
- 收藏
- 关注
原创 用深度学习实现机器翻译
是指将一段文本从一种语言自动翻译到另一种语言。因为一段文本序列在不同语言中的长度不一定相同,所以我们使用机器翻译为例来介绍编码器—解码器和注意力机制的应用。
2024-06-17 14:20:47
664
原创 自然语言处理中的前馈网络
引言自然语言处理(NLP)是人工智能领域中的一个重要分支,它主要研究如何通过计算机理解、解释和生成自然语言文本。前馈神经网络(MLP)是一种常见的模型结构,通过对输入数据进行多层线性和非线性变换,实现复杂的特征提取和分类任务。本文的主要目的是通过对MLP及其相关技术的实现与测试,深入理解其在NLP中的应用及效果,并探讨如何通过各种优化技术提高模型性能。实验内容前馈神经网络的基本实现首先,我们将实现一个简单的MLP模型,并使用其进行姓氏分类任务。这一步的目标是掌握MLP的基本结构和工作原理。
2024-06-17 14:15:20
970
3
原创 基于Transformer实现机器翻译(日译中)
包括目标语言序列的子序列遮罩(用于解码器的自注意力机制),源语言序列的全零遮罩(用于编码器的自注意力机制),以及源语言和目标语言的填充遮罩(用于忽略填充位置的注意力计算)通过以上步骤,我们创建了一个用于训练的DataLoader对象 train_iter,它可以按批次提供填充后的日语和英语数据。通过以上步骤,我们已经准备好了日语和英语的训练数据集,可以用于后续的Transformer模型训练。首先,我们创建函数来翻译新的句子,包括获取日语句子、分词、转换为张量、推理,然后将结果解码回一个英语句子。
2024-06-17 14:07:30
1397
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人