- 博客(2)
- 收藏
- 关注
原创 NLP学习笔记——基于注意力机制的机器翻译
机器翻译,作为自然语言处理的一个核心领域,一直都是研究者们关注的焦点。其目标是实现计算机自动将一种语言翻译成另一种语言,而不需要人类的参与。机器翻译(MT)是一种自动将源语言文本翻译成目标语言的技术。它使用特定的算法和模型,尝试在不同语言之间实现最佳的语义映射。在传统的编码器-解码器架构中,编码器将输入序列压缩成一个固定大小的上下文向量,该向量被传递给解码器。然而,这种方法在处理长句子时效果并不理想,因为固定大小的上下文向量无法有效地捕捉输入序列中的所有信息。注意力机制解决了这个问题。
2024-06-29 09:45:17 991
原创 NLP学习笔记——基于MLP/CNN的姓氏分类系统
为了将文本数据转化为可处理的形式,我们使用词汇表(Vocabulary)类对字符或单词进行映射。Vocabulary类的主要功能是将文本中的token(可以是字符或单词)映射到唯一的整数索引,并且可以处理未知token(通常标记为)。在文本处理中,词汇表用于将原始文本数据转换为整数索引,这对于将文本数据输入到机器学习模型(例如神经网络)中是必不可少的。
2024-06-29 09:33:41 767
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人