自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 使用Transformer进行日中机器翻译的PyTorch教程

在本教程中,我们将使用PyTorch、Torchtext、SentencePiece以及Jupyter Notebook来构建一个日中机器翻译模型。我们将使用JParaCrawl数据集,这是由NTT创建的最大的公开可用英语-日语平行语料库,通过大量爬取网络并自动对齐平行句子而创建。

2024-06-28 21:44:03 257

原创 机器翻译:编码器—解码器和注意力机制的应用。

首先,我们需要定义一些特殊符号,如“”、“”和“”,以及两个辅助函数来预处理数据。这些函数将读取文本数据,将其转换为词索引,并构造词汇表。import osimport io# 定义特殊符号# 读取和预处理数据的辅助函数BLEU通过比较预测序列和标签序列中子序列的精度来评价翻译质量。子序列的精度是指预测序列与标签序列匹配词数为n的子序列的数量与预测序列中词数为n的子序列的数量之比。BLEU的计算公式考虑了匹配不同长度子序列的难度,并给予较长的子序列更高的权重。# ... 省略其他代码 ...

2024-06-28 20:46:13 594

原创 深入理解前馈神经网络:多层感知器和卷积神经网络

这种设计一系列卷积的方法是基于经验的:从数据的预期大小开始,处理一系列卷积,最终得到适合您的特征向量。虽然这种方法在实践中效果很好,但在给定卷积的超参数和输入张量的情况下,还有另一种计算张量输出大小的方法,即使用从卷积运算本身推导出的数学公式。在本博客中,我们将探索MLP的基本概念,并通过PyTorch实现一个简单的MLP模型,用于将姓氏分类到其原籍国。在本博客中,我们将探索CNN的基本概念,并通过PyTorch实现一个简单的CNN模型,用于将姓氏分类到其原籍国。使用第一种方法,只需使用PyTorch的。

2024-06-28 20:28:41 884 1

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除