- 博客(3)
- 收藏
- 关注
原创 使用Transformer和PyTorch的日中机器翻译模型
与英语或其他字母语言不同,日语句子不包含空格来分隔单词。我们可以使用JParaCrawl提供的分词器,该分词器是使用SentencePiece创建的日语和英语,您可以访问JParaCrawl网站下载它们,或单击此处。加载分词器后,您可以测试它们,例如,通过执行以下代码。
2024-06-29 22:09:22 1343
原创 NLP——机器翻译
人类对机器翻译(Machine Translation,MT)系统的研究开发已经持续了 50多年。起初,机器翻译译系统主要是基于双语字典进行直接翻译,几乎没有句法结构分析。直到20世纪80年代,一 些机器翻译系统采用了两种方法:在这些方法中,源语言文本被分析转换成抽象表达形式,随后利用一些程序,通过识别词结构(词法分析)和句子结构(句法分析)解决歧义问题。其中有一种方法将抽象表达设计为一种与具体语种无关的“中间语言”,可以作为许多自然语言的中介。
2024-06-26 11:25:00 1727
原创 多层感知机和CNN姓氏分类——基于Pytorch
感知器有一个致命的缺陷是无法解决异或问题。由此,多层感知机应运而生。多层感知机(MLP,Multilayer Perceptron)也叫人工神经网络一、CNN的基本原理CNN深度学习是一种模型,特别适用于处理图像和序列数据。与传统神经网络相比,CNN具有更好的特征学习能力,能够自动从原始图像中提取出有用的信息。CNN的核心特点是卷积操作,它通过在图像上滑动窗口进行计算,利用滤波器(又称卷积核)和池化层(Max Pooling)来提取图像的特征。
2024-06-26 10:36:03 1880
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人