李宏毅2021年机器学习作业5（Seq2seq）实验记录

最新推荐文章于 2024-07-28 11:52:14 发布

DogDog_Shuai

最新推荐文章于 2024-07-28 11:52:14 发布

阅读量2.7k

点赞数

分类专栏：李宏毅机器学习文章标签： lstm 人工智能 rnn

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_42994201/article/details/121404012

版权

李宏毅机器学习专栏收录该内容

7 篇文章 25 订阅

订阅专栏

李宏毅2021年机器学习作业5学习笔记

前言
一、问题描述
二、实验过程
- 2.1 基于RNN
- 2.2 基于Transformer
三、总结

前言

声明：本文参考了李宏毅机器学习2021年作业例程，开发平台是colab。

一、问题描述

机器翻译
B站作业讲解视频
 Colab地址
在这里插入图片描述

二、实验过程

2.1 基于RNN

操作：直接跑原代码就可以
在这里插入图片描述

中途意外：跑程序时中途断开连接了，再跑就分配不到GPU了。
训练时间：6小时

2.2 基于Transformer

操作：在代码里把Transformer部分注释取消注释，然后调整到相应的参数。
目前colab不太稳定，所以我就不再自己做训练了，结果应该是比RNN的好的。

三、总结

评价指标BLEU

用于机器翻译任务，基于准确率，BLEU 得分越高越好。

参考自https://zhuanlan.zhihu.com/p/223048748

network架构

transformer多头注意力与单头注意力对于不同数据集有不同效果。
输出线性层不宜过多
Conformer相比于Transformer有一定优化

代码链接：

https://github.com/Wangdaoshuai/LHYML2021-Spring

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
2
评论
李宏毅2021年机器学习作业5（Seq2seq）实验记录

李宏毅2021年机器学习作业5学习笔记前言一、问题描述二、实验过程2.1 基于RNN2.2 基于Transformer三、总结前言声明：本文参考了李宏毅机器学习2021年作业例程，开发平台是colab。一、问题描述机器翻译B站作业讲解视频Colab地址二、实验过程2.1 基于RNN操作：直接跑原代码就可以中途意外：跑程序时中途断开连接了，再跑就分配不到GPU了。训练时间：6小时2.2 基于Transformer操作：在代码里把Transformer部分注释取消注释，然后
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。