自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 问答 (1)
  • 收藏
  • 关注

原创 基于transformer与pytorch的日文-中文翻译器

如果只有cpu的话,按照以下配置可以训练但是效果应该是不行的,想要看到训练的效果请使用你自己的带GPU的电脑运行这一套代码,或者去AutoDL算力云平台租借一个GPU当你使用自己的GPU的时候,NUM_ENCODER_LAYERS 和 NUM_DECODER_LAYERS 设置为3或者更高,NHEAD设置8,EMB_SIZE设置为512。SRC_VOCAB_SIZE = len(ja_vocab) # 源语言词汇表大小TGT_VOCAB_SIZE = len(en_vocab) # 目标语言词汇表大小。

2024-06-26 09:19:29 1384

原创 机器翻译实践

考虑批量大小为1的时序数据样本。假设输入序列是𝑥1,…,𝑥𝑇,例如𝑥𝑖是输入句子中的第𝑖个词。在时间步𝑡,循环神经网络将输入𝑥𝑡的特征向量𝑥𝑡和上个时间步的隐藏状态ℎ𝑡−1变换为当前时间步的隐藏状态ℎ𝑡。我们可以用函数𝑓表达循环神经网络隐藏层的变换:接下来,编码器通过自定义函数𝑞将各个时间步的隐藏状态变换为背景变量例如,当选择𝑞(ℎ1,…,ℎ𝑇)=ℎ𝑇时,背景变量是输入序列最终时间步的隐藏状态ℎ𝑇。

2024-06-23 16:45:09 1370

原创 基于前馈网络的利用姓氏进行国籍分类任务

单层感知机是一种最简单的神经网络,可以利用其对一些线性可分的问题进行求解,即生成一条可以完美分割两个类别的分割线。

2024-06-09 16:06:05 1359 2

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除