REMEMBERED1-CSDN博客

原创使用Transformer进行日中机器翻译的PyTorch教程

在本教程中，我们将使用PyTorch、Torchtext、SentencePiece以及Jupyter Notebook来构建一个日中机器翻译模型。我们将使用JParaCrawl数据集，这是由NTT创建的最大的公开可用英语-日语平行语料库，通过大量爬取网络并自动对齐平行句子而创建。

2024-06-28 21:44:03 339

原创机器翻译：编码器—解码器和注意力机制的应用。

首先，我们需要定义一些特殊符号，如“”、“”和“”，以及两个辅助函数来预处理数据。这些函数将读取文本数据，将其转换为词索引，并构造词汇表。import osimport io# 定义特殊符号# 读取和预处理数据的辅助函数BLEU通过比较预测序列和标签序列中子序列的精度来评价翻译质量。子序列的精度是指预测序列与标签序列匹配词数为n的子序列的数量与预测序列中词数为n的子序列的数量之比。BLEU的计算公式考虑了匹配不同长度子序列的难度，并给予较长的子序列更高的权重。# ... 省略其他代码 ...

2024-06-28 20:46:13 737

原创深入理解前馈神经网络：多层感知器和卷积神经网络

这种设计一系列卷积的方法是基于经验的:从数据的预期大小开始，处理一系列卷积，最终得到适合您的特征向量。虽然这种方法在实践中效果很好，但在给定卷积的超参数和输入张量的情况下，还有另一种计算张量输出大小的方法，即使用从卷积运算本身推导出的数学公式。在本博客中，我们将探索MLP的基本概念，并通过PyTorch实现一个简单的MLP模型，用于将姓氏分类到其原籍国。在本博客中，我们将探索CNN的基本概念，并通过PyTorch实现一个简单的CNN模型，用于将姓氏分类到其原籍国。使用第一种方法，只需使用PyTorch的。

2024-06-28 20:28:41 1253 1