深度学习模型推理速度缓慢原因分析

keep_forward

于 2017-12-23 10:34:55 发布

阅读量2w

点赞数 7

分类专栏： deeplearning 文章标签：深度学习推理速度慢

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/b876144622/article/details/78878581

版权

deeplearning 专栏收录该内容

10 篇文章

订阅专栏

本文分析了模型在实际应用中推理速度变慢的原因，并提出了解决方案。主要原因是数据读取方式及批量处理的不同，解决方案包括多线程读取数据及采用批处理。

摘要生成于 C知道，由 DeepSeek-R1 满血版支持，前往体验 >

碰到一个问题，在训练好一个模型后，实际使用时，即只有前向推理过程，速度缓慢，大概1s能执行100次。之所以会认为推理的速度变慢，主要原因在于，在训练模型时，会在训练集和验证集上，获取算法的准确率，那么就需要进行前向推理。在这里，会有大概500,000个样本，而只需要200s左右，大约2500/s。

那么为什么在实际进行推理时速度会变慢这么多呢？

分析后发现，主要原因有二：

1、训练模型时，读取的数据是tfrecord格式的数据，有其它线程负责把数据导入内存，大大降低了从硬盘读取内存的开销；
2、在训练模型，是按照batch读取数据，然后输入到网络中进行批量处理，一个batch大小为128，而在实际使用时，一般是单个样本输入，这就导致了推理速度变慢。

对于原因1，可以采用相似的方式，另起线程读数据，然后再处理。

对于原因2，如果实时性要求不是特别高，能够缓冲一部分再做处理，那么可以按照batch批处理的方式完成。可以大大加快运行速度。

博客等级

码龄13年

113
原创

612
点赞

1697
收藏

112
粉丝

关注

私信

热门文章

分类专栏

recom 3篇
深度学习推荐系统读书笔记 3篇
charge
home
excel
leetcode
algorithms 3篇
python 22篇
deeplearning 10篇
caffe 16篇
linux 16篇
tensorflow 13篇
office 3篇
machine learning 20篇
markdown
git 3篇
putty 1篇
c/cpp 6篇
make 2篇
other
mathematics 1篇

展开全部收起

最新评论

tensorflow 恢复部分参数、加载指定参数
流木追风: 还可以通过tf.compat.v1.get_collection(tf.compat.v1.GraphKeys.GLOBAL_VARIABLES, scope=<name_scope>)方法读取特定name_scope的参数变量信息
Makefile中:=, =, ?=和+=的含义
gerdios: 个人理解：可以用时间轴的概念辅助理解，设想一个时间轴，有第1赋值点，现在赋值点和下一赋值点三个点，现在处于当前赋值点，那么 “=” 赋值后，变量的值将影响第1赋值点直到下一赋值点前的变量值；“:=” 仅影响当前赋值点到下一赋值点前的变量值；"?=" 仅在第1赋值点有效，其余赋值点则忽略
Makefile中:=, =, ?=和+=的含义
clearmann: 没有必要，这不是应试考试，大家都会避免写有歧义的代码
Makefile中:=, =, ?=和+=的含义
TT_str: 如果先=后:=会怎么样如果先:=后=会怎么样
Makefile中:=, =, ?=和+=的含义
找bug小能手zz: 通俗易懂，感谢

最新文章

目录

展开全部

收起

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。