177 页 PPT 带你了解出行领域的计算机视觉技术

滴滴技术

于 2019-07-13 10:49:23 发布

阅读量1.8k

点赞数

原文链接：https://outreach.didichuxing.com/ICME2019

版权

桔妹导读：滴滴 CV in Transportation 讲习班以实践应用为核心，多方面地讲解当前视觉技术在交通领域的应用与原理。一起来回顾讲习班课程内容吧，获取教程 PDF 请见文末。

在垂直领域找到与技术深度结合的应用场景是当前计算机视觉技术落地的一个重要命题。计算机视觉技术的落地也势必会直接影响我们衣食住行的方方面面。特别在出行领域，计算机视觉技术的应用将会极大提高交通运行效率和安全水平。

滴滴 Computer Vision in Transportation 讲习班以实践应用为核心，多方面地讲解当前视觉技术在交通领域的应用与原理。第一部分覆盖交通领域视觉应用背后支撑的方法和原理，包括深度学习知识、图像分类以及目标检测等；第二部分主要集中讲在交通领域的应用中所需要的前沿性探索问题：域适应 (Domain Adaptation) 和轻量级模型 (Lightweight Models)；最后一部分讲述了计算机视觉在出行领域的两大应用方向。

1.

计算机视觉导论

Introduction to Computer Vision

▍课程讲师

车正平博士 | 滴滴 AI Labs

▍课程大纲

Computer Vision Basics
- Representation Learning
- Activation Functions
- Neural Network Structures
- Convolution Operators
- Pooling Layers
- Batch Normalization
Image Classification
- Datasets & Competitions
- Roadmap
- Classification Networks
- Experiments
Object Detection
- Introduction & Roadmap
- Region-Based Methods
- Region-Free Methods
- Experiments

▍课程亮点

在本演讲中，简明扼要地讲述了深度学习时代的视觉技术基础，如表征学习、激活函数、神经网络、卷积操作、池化层和批归一化等入门知识，详细地介绍了图像分类和目标检测的全局路线图和代表性工作，分享了在实践中发现的几个痛点：模型对昂贵的标注数据的依赖性；已有模型无法在新的环境中直接使用；对计算资源的高需求；以及端上能力推广的局限性。

▍延伸阅读

密西根大学40页《20年目标检测综述》最新论文，带你全面了解目标检测方法

2.

前沿话题

Advanced Topics

▍课程讲师

郭玉红教授 | 滴滴 AI Labs 首席研究员，加拿大 carleton University 郭玉红教授

▍课程大纲

Domain Adaptation
- Introduction
- Application in Computer Vision
- Domain Adaptation Methods
Lightweight Models
- Basics
- Inception, Xception *
- SqueezeNet
- MobileNet / MobileNetV2
- ShuffleNet / ShuffleNetV2

▍课程亮点

基于前文提出的痛点与挑战，在本演讲中分享了两个前沿话题：Domain Adaptation和Lightweight Models。其中Domain Adaptation旨在解决如何从原始问题学习到的模型能够很好地适应与之不相同的目标问题。而Lightweight Models可以很好地解决模型存储和速度问题，通过构建轻量级模型让深度卷积神经网络保持精度的同时，模型体积更小，占用更少的资源。

3.

应用

Application

▍课程讲师

沈海峰博士、李广宇博士 | 滴滴 AI Labs

沈海峰博士分享人脸技术

李广宇博士分享驾驶场景理解应用

▍课程大纲

Driver Identification
- Application
- Overview
- Experiments
Driving Scenario Understanding
- Vision Perception
- 3D Reconstruction
- Behavior Analysis

▍课程亮点

本演讲中举例计算机视觉在交通的两大应用点，司机认证和驾驶场景理解。其中司机认证主要涉及人脸检测和识别技术。沈海峰博士介绍了人脸技术的一些典型应用，特点和挑战；回顾了人脸检测主流技术以及识别主流技术的演进。并且分享了滴滴在NeurIPS2018的论文Virtual Class Enhanced Discriminative Embedding Learning以及WIDER FACE人脸检测竞赛5项单项第一的算法模型。

驾驶场景理解是一个涵盖全方面视觉技术的应用话题。李广宇博士从场景中有什么，物体和车之间的关系（距离）以及司机对环境的反应三个角度，即视觉感知、三维重建和行为分析进行讲解。视觉感知简单地讲述了通用视觉和驾驶场景理解视觉技术不同点，分享了行人检测、车辆检测、车道线分割、交通灯检测等应用；三维重建部分深入浅出地介绍了基础知识和语义重建；最后演讲关注于驾驶场景的深度感知与理解。

▍延伸阅读

[1] 滴滴AI Labs包揽WIDER FACE评测五项世界第一

[2] Learning Better Features for Face Detectionwith Feature Fusion and Segmentation Supervision

[3] Virtual Class Enhanced DiscriminativeEmbedding Learning.

[4] 滴滴盖亚开放数据

本文首发自：滴滴科技合作

作者：孟一平编辑：洛羽

获取177页PDF
▬
请在「滴滴技术」公众号后台
回复「PDF」即可直接获取
推荐阅读
▬




更多推荐
▬
滴滴开源 / Open Source
Mpx | Booster | Chameleon | DDMQ | DroidAssist | Rdebug | Doraemonkit | Kemon | Mand Moblie | virtualApk | 获取更多项目
技术干货 / Recommended article
深度解密 Go 语言：关于 interface 的 10 个问题 | 滴滴宋世君：DS(数据分析师)，究竟是做什么的？ | 一个 Golang 项目的测试实践全记录 | 阅读更多内容