DL-Paper精读：HAT

最新推荐文章于 2023-04-18 12:15:00 发布

VIP文章星月野

最新推荐文章于 2023-04-18 12:15:00 发布

阅读量284

点赞数

分类专栏： paper阅读文章标签：人工智能深度学习算法机器学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/li6016265/article/details/117485831

版权

HAT: Hardware-Aware Transformers for Efficient Natural Language

Background
Issue
Proposed Approaches
- Arbitrary Encode-Decoder Attention
- Heterogeneous Layers
Experiments
Thoughts

Background

Transformer被广泛应用于NLP领域，但是它在移动端的部署问题一直都是一个巨大的挑战。例如，处理一个30words的翻译问题，采用Transformer-Big模型，需要执行13G的浮点数运算，在Raspberry上耗时约20秒，这严重制约了Transformer在移动设备上的用户体验。因此提出了针对于硬件特性&#

最低0.47元/天解锁文章

关注

0
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
DL-Paper精读：HAT

HAT: Hardware-Aware Transformers for Efficient Natural Language BackgroundIssueProposed ApproachesArbitrary Encode-Decoder AttentionHeterogeneous LayersExperimentsThoughtsPaper PDFBackgroundTransformer被广泛应用于NLP领域，但是它在移动端的部署问题一直都是一个巨大的挑战。例如，处理一个30words的翻
复制链接

扫一扫

专栏目录

星月野 CSDN认证博客专家 CSDN认证企业博客

码龄7年

31: 原创

16万+: 周排名

168万+: 总排名

3万+: 访问

: 等级

463: 积分

4: 粉丝

14: 获赞

15: 评论

75: 收藏

私信

关注

热门文章

分类专栏

最新评论

DL-Paper精读：LSTM + Transformer 架构模型
qq_62446823: 有链接吗？可以分享一下吗？
DL-Paper精读：LSTM + Transformer 架构模型
将在外，君命有所不受: 能不能告诉我是那一片github，是temsorflow编的吗？
DL-Paper精读：LSTM + Transformer 架构模型
将在外，君命有所不受: 谢谢您您太强了
DL-Paper精读：LSTM + Transformer 架构模型
m0_56402051: github上有一个transformer-lstm模型，应该是论文的代码，由于没有说明，正在研究网络结构，应该是这个论文改的预测时序的。能用，而且准确率对比lstm确实高了一点点
DL-Paper精读：LSTM + Transformer 架构模型
将在外，君命有所不受: 可以用来预测时间序列吗？

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。