自动驾驶（十九）---------深度学习与机器视觉

最新推荐文章于 2024-08-07 09:45:47 发布

一实相印

最新推荐文章于 2024-08-07 09:45:47 发布

阅读量1.1w

点赞数 3

分类专栏：自动驾驶

本文链接：https://blog.csdn.net/zhouyy858/article/details/99943955

版权

87 篇文章 1112 订阅

订阅专栏

深度学习毫无疑问成为热点，尤其是和机器视觉相结合，到底目前具体有那些应用，本文简单归纳如下：

AlexNet应该算第一个深度CNN；
ZFNet采用DeconvNet和visualization技术可以监控学习过程；
VGGNet采用小滤波器3X3去取代大滤波器5X5和7X7而降低计算复杂度；
GoogleNet推广NIN的思路定义Inception基本模块（采用多尺度变换和不同大小滤波器组合，即1X1，3X3，5X5）构建模型；
Highway Networks借鉴了RNN里面LSTM的gaiting单元；
ResNet是革命性的工作，借鉴了Highway Networks的skip connection想法，可以训练大深度的模型提升性能，计算复杂度变小；
Inception-V3/4用1X7和1X5取代大滤波器5X5和7X7，1X1滤波器做之前的特征瓶颈，这样卷积操作变成像跨通道（cross channel）的相关操作；
DenseNet主要通过跨层链接解决vanishing gradient问题；
SE-Net是针对特征选择的设计，gating机制还是被采用；
前段时间流行的Attention机制也是借鉴于LSTM，实现object-aware的context模型。

在具体应用领域也出现了不少成功的模型，比如

detection问题的R-CNN，fast RCNN，faster RCNN，SSD，YOLO，RetinaNet，CornerNet等，
解决segmentation问题的FCN，DeepLab，Parsenet，Segnet，Mask R-CNN，RefineNet，PSPNet，U-Net等，
处理激光雷达点云数据的VoxelNet，PointNet，BirdNet，LMNet，RT3D，PIXOR，YOLO3D等，
实现激光雷达和图像融合的PointFusion，RoarNet，PointRCNN，AVOD等，
做图像处理的DeHazeNet，SRCNN (super-resolution)，DeepContour，DeepEdge等，
2.5 D视觉的MatchNet，DeepFlow，FlowNet等，
3-D重建的PoseNet，VINet，Perspective Transformer Net，SfMNet，CNN-SLAM，SurfaceNet，3D-R2N2，MVSNet等，
以及解决模型压缩精简的MobileNet，ShuffleNet，EffNet，SqueezeNet，