- 博客(3)
- 问答 (1)
- 收藏
- 关注
原创 基于transformer与pytorch的日文-中文翻译器
如果只有cpu的话,按照以下配置可以训练但是效果应该是不行的,想要看到训练的效果请使用你自己的带GPU的电脑运行这一套代码,或者去AutoDL算力云平台租借一个GPU当你使用自己的GPU的时候,NUM_ENCODER_LAYERS 和 NUM_DECODER_LAYERS 设置为3或者更高,NHEAD设置8,EMB_SIZE设置为512。SRC_VOCAB_SIZE = len(ja_vocab) # 源语言词汇表大小TGT_VOCAB_SIZE = len(en_vocab) # 目标语言词汇表大小。
2024-06-26 09:19:29
1384
原创 机器翻译实践
考虑批量大小为1的时序数据样本。假设输入序列是𝑥1,…,𝑥𝑇,例如𝑥𝑖是输入句子中的第𝑖个词。在时间步𝑡,循环神经网络将输入𝑥𝑡的特征向量𝑥𝑡和上个时间步的隐藏状态ℎ𝑡−1变换为当前时间步的隐藏状态ℎ𝑡。我们可以用函数𝑓表达循环神经网络隐藏层的变换:接下来,编码器通过自定义函数𝑞将各个时间步的隐藏状态变换为背景变量例如,当选择𝑞(ℎ1,…,ℎ𝑇)=ℎ𝑇时,背景变量是输入序列最终时间步的隐藏状态ℎ𝑇。
2024-06-23 16:45:09
1370
原创 基于前馈网络的利用姓氏进行国籍分类任务
单层感知机是一种最简单的神经网络,可以利用其对一些线性可分的问题进行求解,即生成一条可以完美分割两个类别的分割线。
2024-06-09 16:06:05
1359
2
空空如也
C语言求5*4的迷宫最短路径
2022-01-22
TA创建的收藏夹 TA关注的收藏夹
TA关注的人