计算机视觉 Computer Vision
主要学习内容
1.计算机视觉的基础
- 数据图像处理
- 图像特征及描述
2.深度学习在计算机视觉中的应用
- 图像分类:卷积神经网络 CNN
- 图像检测:区域卷积神经网络 R-CNN
- 图像分割:全卷积神经网络 FCN
- 图像描述:迭代神经网络 RNN
- 图像问答:迭代神经网络 RNN
- 图像生成:生成对抗网络 GAN
3.图像检索
重点
- 深度神经网络模型
- TensorFlow
实践环境
- OpenCV
- TensorFlow (CPU/GPU)
参考书
- Python: 《learn python the hard way》
- OpenCV:《OpenCV 3计算机视觉:Python语言实现》
- TensorFlow:《TensorFlow:实战Google深度学习框架》
计算机视觉
模拟人类视觉的优越能力:
- 识别人、物体、场景
- 估计立体空间、距离
- 躲避障碍物进行导航
- 想象并描述故事
- 理解并讲解图片……
弥补人类视觉的缺陷:
- 关注显著内容、容易忽视细节
- 不在乎、不擅长精细感知
- 容易受幻觉干扰
- 描述主观、模棱两可
- 不善于长时间稳定的执行同一个任务……
1.语义感知
- 分类 Classification
物体、属性、场景等 - 检测 Detection
物体、行人、人脸等 - 识别 Recognition
- 物体:车牌、文本
- 人:人脸、指纹、虹膜、步态、行为等
- 分割 Segmentation
- 检索 Retrieval
以文搜图、以图搜图、图文联搜等 - 语