自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 使用Transformer和PyTorch的日-中机器翻译模型使用--Jupyter、 Notebook、PyTorch、Torchtext和SentencePiece的教程

总共,在训练集(trainen)和训练日语集(trainja)中句子的数量为 5,973,071 条,然而,为了学习目的,通常建议对数据进行抽样,并确保一切按预期运行,然后再一次性使用所有数据,以节省时间。这里,我将BATCH_SIZE设为16,以防止“cuda内存溢出”,但这取决于各种因素,比如您的机器内存容量、数据大小等,所以根据您的需要随时更改批量大小(注意:PyTorch的教程在Multi30k德英数据集上将批量大小设为128)。最终,在准备好必要的课程和函数之后,我们准备开始训练我们的模型。

2024-06-22 23:50:48 627

原创 NLP--机器翻译

机器翻译是利用计算机将一种自然语言(源语言)转换为另一种自然语言(目标语言)的过程,是计算语言学的一个分支,也是人工智能的终极目标之一。机器翻译技术的发展紧密伴随着计算机技术、信息论和语言学等学科的进步。从早期的词典匹配,到词典结合语言学专家知识的规则翻译,再到基于语料库的统计机器翻译,随着计算能力的提升和多语言信息的爆炸式增长,机器翻译技术逐渐走出象牙塔,开始为普通用户提供实时便捷的翻译服务。

2024-06-22 23:09:30 1059

原创 简单神经网络的应用--多层感知器的姓氏分类

一、实验内容我们通过观察感知器来介绍神经网络的基础,感知器是现存最简单的神经网络。感知器的一个历史性的缺点是它不能学习数据中存在的一些非常重要的模式。例如,查看图4-1中绘制的数据点。这相当于非此即彼(XOR)的情况,在这种情况下,决策边界不能是一条直线(也称为线性可分)。在这个例子中,感知器失败了。图4-1 XOR数据集中的两个类绘制为圆形和星形。请注意,没有任何一行可以分隔这两个类。在这一实验中,我们将探索传统上称为前馈网络的神经网络模型,以及两种前馈神经网络:多层感知器和卷积神经网络。

2024-06-22 18:34:21 1066

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除