自定义博客皮肤VIP专享

*博客头图:

格式为PNG、JPG,宽度*高度大于1920*100像素,不超过2MB,主视觉建议放在右侧,请参照线上博客头图

请上传大于1920*100像素的图片!

博客底图:

图片格式为PNG、JPG,不超过1MB,可上下左右平铺至整个背景

栏目图:

图片格式为PNG、JPG,图片宽度*高度为300*38像素,不超过0.5MB

主标题颜色:

RGB颜色,例如:#AFAFAF

Hover:

RGB颜色,例如:#AFAFAF

副标题颜色:

RGB颜色,例如:#AFAFAF

自定义博客皮肤

-+

手撕Transformer

本专栏逐一讲解Transformer各模块的内容,用它来实现一个中英翻译任务。可以学到编码器层、解码器层、生成器层的实现。此外还可以学习动态学习率调整策略,多GPU并行训练。
关注数:0 文章数:8 文章阅读量:2284 文章收藏量:12

作者: 木珊数据挖掘

喜欢数学建模,喜欢机器学习,具有丰富的数学建模竞赛经验,撰写过二十余篇竞赛论文。获得过“华为杯”第十九届中国研究生数学建模竞赛二等奖;“华为杯”第二十届中国研究生数学建模竞赛二等奖;一篇论文被评为浙江省优秀实践案例;第十一届“泰迪杯”数据挖掘挑战赛三等奖;2022年MathorCup高校数学建模挑战赛—大数据竞赛二等奖;获第六届“泰迪杯”数据分析技能赛一等奖。
展开