- 博客(3)
- 收藏
- 关注
原创 基于Transformer实现机器翻译(日译中)
Define model parameters and instantiate model. 这里我们服务器实在是计算能力有限,按照以下配置可以训练但是效果应该是不行的。如果想要看到训练的效果请使用你自己的带GPU的电脑运行这一套代码。当你使用自己的GPU的时候,NUM_ENCODER_LAYERS 和 NUM_DECODER_LAYERS 设置为3或者更高,NHEAD设置8,EMB_SIZE设置为512。
2024-06-26 23:43:17 1704
原创 NLP机器翻译实验记录
机器翻译是指将一段文本从一种语言自动翻译到另一种语言。因为一段文本序列在不同语言中的长度不一定相同,所以我们使用机器翻译为例来介绍编码器—解码器和注意力机制的应用。
2024-06-26 23:38:51 1668
原创 基于多层感知器(MLP)实现姓氏分类
与Yelp评论的词汇表不同,我们使用的是one-hot词汇表,不计算字符出现的频率,只对频繁出现的条目进行限制。虽然我们在这个示例中使用了收缩的one-hot,但是在后面的实验中,将了解其他向量化方法,它们是one-hot编码的替代方法,有时甚至更好。具体来说,在“示例:使用CNN对姓氏进行分类”中,将看到一个热门矩阵,其中每个字符都是矩阵中的一个位置,并具有自己的热门向量。这就是所谓的“概率”。感知器是现存最简单的神经网络,但有其局限性,即不能学习数据中一些非常重要的模式,例如某些线性不可分的情况。
2024-06-16 00:26:25 1689 1
空空如也
空空如也
TA创建的收藏夹 TA关注的收藏夹
TA关注的人