Towards Computationally Efficient and Realtime Distracted Driver Detection With MobileVGG Network
第一遍:读标题、摘要和图表
标题: 基于移动VGG网络的实时高效的司机分心驾驶检测
摘要: 本文提出了基于深层可分离卷积的移动VGG网络结构,用在两个数据集上效果都很好,而且大小只有2.2M。实现了实时高效。
图表:
图一:标准卷积和其等价深层可分离卷积,好像就是把一个大块按长度和按面积分成了一小块一小块
图二/表一:移动VGG网络结构
图三:数据集中司机行为的分类
图四:训练和测试的loss和accuracy
表二四:CONFUSION MATRIX OF PROPOSED MOBILEVGG ARCHITECTURE
ON AUC DATASET基于澳柯币数据的移动互联网架构的混淆???这个表没看懂
表三五:两个数据集上的accuracy
图五:标错的label及其正确label
表六七八:和其他的网络比较时间和accuracy
第二遍:读引言和结论部分,再浏览一遍图片,并快速浏览论文的其他部分。
讲讲他的危害多么严重,然后说明自己做的东西多么重要,介绍下其他人的研究,再说说他们哪里不足,准确率不够或者效率不够,然后提出自己的新的CNN模型,在效率提高的同时又保证准确率。
第三遍:阅读论文的全部内容,适当跳过复杂的公式
具体怎么做的呢,基于深层可分离卷积的移动VGG网络结构,当然要介绍深度可分离卷积和VGG啦。
1.深度可分离卷积
简单来说就是标准的卷积运算成本太大,而深度可分离卷积分为深度卷积和逐点卷积,可以大大减少运算量,具体怎么做的还需要好好琢磨
为什么它可以实现呢,就是把一个标准的卷积分为深度和逐点,这个通道到底是怎么计算的呢,有点懵,要回去看看神经网络的知识回忆下
2.VGG16
由于VGG的参数数量很大,在嵌入式设备上部署是不可行的。因此,提出了一种体积小得多的全卷积神经网络:移动VGG
3.移动VGG
使用深度可分离卷积构建的,只有第一层涉及标准卷积,架构类似VGG16,但作为一种全卷积网络,其中全连接层由1X1卷积替代,其大小减到了512个神经元,大大节省了计算成本,减少了大量参数,并适合于任何输入大小。然后推出最后的计算量远小于VGG16.具体网络怎么做的还需要推敲。
4.数据集
5.结论
做的好