笔记本 yolov3-tiny 加速的意外之喜(tf-AVX加速)

本文介绍了作者在CPU上运行yolov3-tiny时遇到的速度问题,以及如何通过安装支持AVX、AVX2的特定版本tensorflow实现加速,从0.25s/帧提升到0.15s/帧,从而改善了程序的运行效率。
摘要由CSDN通过智能技术生成

提示:

如果你用的是GPU,那就点击本页面右上角的X,本文针对的是CPU

 

环境

anaconda

python 3.7

tensorflow 1.13.1

numpy 1.16.0

 

背景:

    在学校做毕设,是基于树莓派小车云边协同行人跟随。我用的是yolov3 tiny算法作为检测行人的算法(因为笔记本是轻薄本,性能很差)。现在基本做完了,但是yolov3t算法在我的笔记本上的运行速度是0.25s/帧,显示画面还是很卡的。于是乎我这几天一直在找比yolov3t更轻便的算法,但是没啥收获,自我感觉这个网络已经很简单了。

    期间,由于我的网络只用于检测人,所以修改了输出层(减少了点参数,没准速度快一丢丢),到网吧用显卡添加数据集去训练,但是发现网吧的显卡加速并不快,也就比用CPU快一倍的样子,以前训练VGG那可是快了十倍不止啊,就很奇怪,看着截止时间要30h,遂放弃。

    就在这一筹莫展,本着“差不多就行了”的思想准备放弃,收拾东西回家过年之时。我突然留意到每次运行代码时出现的一段话,大意就是我的CPU支持AVX、AVX2编译巴拉巴拉,我百度一搜,发现很多都是屏蔽这个消息的方法,但是有人说可以通过安装别人处理好的tensorflow来让CPU支持这个,而且还可以加速,还可以加速!

    我跟着方法,去Github下载,但是Github上下载都是下载整个仓库,但是这也太大了,我又没翻过墙,下载速度只有2

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值