模型性能对比

无铭的落魄诗人

已于 2022-07-19 17:36:59 修改

阅读量267

点赞数

文章标签：深度学习

于 2022-07-19 16:04:34 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/m0_37050445/article/details/125869269

版权

分类任务

实验设置

属性	内容
数据集名称	随机数矩阵
平均文本长度	30
设备	GTX 1080 Ti(11G)
batchsize	258
batchnum	100
优化器	Adamw

实验结果

模型	参数设置	参数量	推断时间/batch(s)	训练时间/batch(s)
Transformer_encoder_dnn	d_model=dim_word, nhead=8,num_head=6	32.13M	0.0427s	0.2134s
CNN_maxpool_dnn	k_num[512,512,512], width=[3,4,5], stride=[1,1,1]	4.64M	0.0396 s	0.0111 s
GRU_dnn	512	1.96M	0.0117s	0.0058s

RNN具有记忆功能，被遍历的单元具有因果联系作用(记忆信息传送)，上一时刻隐层的状态参与到了这个时刻的计算过程中，这句话的举例说明就是第一个单元计算的结果会作为第二个单元输入的一部分，所以，当前单元必须等上一单元计算结束，有多少单元就需要计算多少次。

CNN同一层次单元没有因果关系都是等价的，这样就可以依据单元核直接复制出所需所有单元核(参数相同)，然后采用矩阵并行运算，只需计算一次。

无铭的落魄诗人

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
1
评论
模型性能对比

文本分类实验设置实验结果。
复制链接

扫一扫

无铭的落魄诗人 CSDN认证博客专家 CSDN认证企业博客

码龄8年

6: 原创

123万+: 周排名

224万+: 总排名

2429: 访问

: 等级

91: 积分

1: 粉丝

0: 获赞

2: 评论

4: 收藏

私信

关注

分类专栏

最新评论

Anaconda常用指令
摇风似醉酒: 退出环境写错了 conda deactivate

您愿意向朋友推荐“博客详情页”吗？

强烈不推荐
不推荐
一般般
推荐
强烈推荐

提交

最新文章

目录

评论 1

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。