- 博客(3)
- 收藏
- 关注
原创 使用Transformer进行日中机器翻译的PyTorch教程
在本教程中,我们将使用PyTorch、Torchtext、SentencePiece以及Jupyter Notebook来构建一个日中机器翻译模型。我们将使用JParaCrawl数据集,这是由NTT创建的最大的公开可用英语-日语平行语料库,通过大量爬取网络并自动对齐平行句子而创建。
2024-06-28 21:44:03
257
原创 机器翻译:编码器—解码器和注意力机制的应用。
首先,我们需要定义一些特殊符号,如“”、“”和“”,以及两个辅助函数来预处理数据。这些函数将读取文本数据,将其转换为词索引,并构造词汇表。import osimport io# 定义特殊符号# 读取和预处理数据的辅助函数BLEU通过比较预测序列和标签序列中子序列的精度来评价翻译质量。子序列的精度是指预测序列与标签序列匹配词数为n的子序列的数量与预测序列中词数为n的子序列的数量之比。BLEU的计算公式考虑了匹配不同长度子序列的难度,并给予较长的子序列更高的权重。# ... 省略其他代码 ...
2024-06-28 20:46:13
594
原创 深入理解前馈神经网络:多层感知器和卷积神经网络
这种设计一系列卷积的方法是基于经验的:从数据的预期大小开始,处理一系列卷积,最终得到适合您的特征向量。虽然这种方法在实践中效果很好,但在给定卷积的超参数和输入张量的情况下,还有另一种计算张量输出大小的方法,即使用从卷积运算本身推导出的数学公式。在本博客中,我们将探索MLP的基本概念,并通过PyTorch实现一个简单的MLP模型,用于将姓氏分类到其原籍国。在本博客中,我们将探索CNN的基本概念,并通过PyTorch实现一个简单的CNN模型,用于将姓氏分类到其原籍国。使用第一种方法,只需使用PyTorch的。
2024-06-28 20:28:41
884
1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人