自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+
  • 博客(3)
  • 收藏
  • 关注

原创 姓氏分类:基于MLP和CNN分别实现

然而,这种增长不会很大(尤其是与“用CNN对姓氏进行分类的例子”中的模型相比)。尽管我们使用了来自“带有多层感知器的姓氏分类”中的相同数据集,但在实现上有一个不同之处:数据集由one-hot向量矩阵组成,而不是一个收缩的one-hot向量。如果你想在GPU上运行,要确保在 GPU 计算中使用的所有张量和模型都在同一设备上,以避免设备不匹配错误。管理姓氏和国籍的词汇表,并提供将姓氏向量化为one-hot编码的功能。将姓氏和国籍向量化,并计算每个类别的权重,以便在深度学习模型中使用。测试集的准确率和损失值。

2024-06-30 11:45:50 647

原创 机器翻译:编码器—解码器和注意力机制的应用

BLEU是机器翻译领域一个常用的质量评估指标,其基本思想是通过比较机器翻译的结果和人工翻译的结果在词级别上的匹配度来评估翻译质量。BLEU主要关注的是N-Gram精度,会计算不同长度N-Gram的精度,并结合这些精度得到一个综合评估。此外,BLEU还引入一个简短惩罚因子,避免过短的翻译获得过高的评分。"""计算BLEU分数。

2024-06-29 14:47:54 940

原创 中日机器翻译模型:基于Transformer和PyTorch

设置随机种子的作用是确保在每次运行代码时生成的随机数相同,这样可以提供代码的可重复性和结果的一致性。这些掩码在编码器和解码器中用于确保模型不会处理填充的位置(即序列中用于对齐的空位置),从而提高模型的性能和准确性。最后,将Google Drive挂载到Colab的文件系统中,以便于数据集的使用以及代码的保存(Colab的文件系统在每次新的会话开始时都会重新初始化,不会保留之前会话中。通过查看具体的样本,可以确认数据是否符合预期,并且可以发现潜在的格式或内容问题,用于确保数据集的正确性和完整性。

2024-06-26 17:18:37 783

空空如也

空空如也

TA创建的收藏夹 TA关注的收藏夹

TA关注的人

提示
确定要删除当前文章?
取消 删除