分类
定义
ILSVRC竞赛
经典CNN
Alexnet
Network-in-Network
VGG
GoogLeNet
- Inception V1
- Inception V2
- Inception V3
ResNet
- ResNeXt
CNN的设计准则
- 避免信息瓶颈
- 通道(数量)保持在可控范围内
- 感受野要足够大
- 分组策略-降低计算量
- 低秩分解-降低计算参数&计算量
检测
定义
ILSVRC
区域卷积神经网络(R-CNN)
R-CNN
SPP-NET
Fast/Faster R-CNN
区域全卷积神经网络(R-FCN)
YOLO系列
- YOLO v1
- YOLO v2/9000
- YOLO v3
人脸检测和行人检测的数据集
- FDDB
- IJB-A
- Caltech
识别
常规场景下图像分割
定义
网络
- FCN
- DeepLab
数据集
- Pascal VOC
- MSCOCO
- Cityspaces
医学场景下图像分割
医学图像影像种类与存储
分割任务与数据集
分割模型
U-net
3D U-Net
V-Net
DenseNet
FC-DenseNet
检索
定义
图像检索流程
相似度检索
- 颜色、纹理、形状
- 局部特征点
- 词包(bag of visual word)
索引加速
- KD-tree
- 局部敏感哈希(LSH)
描述
深度语言模型
RNN
LSTM原理
图说模型原理与结构
数据集
生成
定义
变分自编码器
生成对抗网络(GAN)
- DC-GAN
- WGAN
- SRGAN
GAN的应用
- 图像生成中
- 传统CV问题中