- 博客(3)
- 收藏
- 关注
原创 基于Transformer实现机器翻译(日译中)
本实验旨在使用Transformer模型实现日语到中文的机器翻译。Transformer模型由于其并行化能力和优秀的翻译效果,成为了当前机器翻译领域的主流方法。本实验使用了Pytorch框架,并基于日语和中文的平行语料库进行训练和评估。为了监控训练进展,每个epoch结束时我们会输出训练损失和耗时。在本实验中,我们使用了一个标准的Transformer模型,包括编码器和解码器。首先,我们读取了日语-中文平行语料库,并进行预处理。我们可以在训练结束后保存模型,以便在后续进行推理或继续训练。
2024-06-22 16:53:53 320
原创 自然语言处理前馈网络
自然语言处理(NLP)是人工智能中的一个重要领域,它涉及计算机理解、解释和生成人类语言的能力。前馈神经网络(MLP)是NLP任务中常用的一种模型结构,通过对输入数据进行多层线性和非线性变换,实现复杂的特征提取和分类任务。本文实验的主要目的是通过对MLP及其相关技术的实现与测试,深入理解其在NLP中的应用及效果。通过本次实验,我们深入了解了前馈神经网络在自然语言处理中的应用及其性能影响因素。Dropout和BatchNorm作为两种重要的正则化技术,有效地提高了模型的泛化能力和训练稳定性。
2024-06-08 15:58:12 1792
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人