自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(2)
  • 收藏
  • 关注

原创 NLP学习笔记——基于注意力机制的机器翻译

机器翻译,作为自然语言处理的一个核心领域,一直都是研究者们关注的焦点。其目标是实现计算机自动将一种语言翻译成另一种语言,而不需要人类的参与。机器翻译(MT)是一种自动将源语言文本翻译成目标语言的技术。它使用特定的算法和模型,尝试在不同语言之间实现最佳的语义映射。在传统的编码器-解码器架构中,编码器将输入序列压缩成一个固定大小的上下文向量,该向量被传递给解码器。然而,这种方法在处理长句子时效果并不理想,因为固定大小的上下文向量无法有效地捕捉输入序列中的所有信息。注意力机制解决了这个问题。

2024-06-29 09:45:17 991

原创 NLP学习笔记——基于MLP/CNN的姓氏分类系统

为了将文本数据转化为可处理的形式,我们使用词汇表(Vocabulary)类对字符或单词进行映射。Vocabulary类的主要功能是将文本中的token(可以是字符或单词)映射到唯一的整数索引,并且可以处理未知token(通常标记为)。在文本处理中,词汇表用于将原始文本数据转换为整数索引,这对于将文本数据输入到机器学习模型(例如神经网络)中是必不可少的。

2024-06-29 09:33:41 767

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除