一. 常用网络
深度学习相关的几个比较著名的网络,AlexNet、VGG、GoogleNet、ResNet。
模型
AlexNet
VGG
GoogleNet
ResNet
时间
2012
2014
2014
2015
层数
8
19
22
152
Top-5错误率
15.3%
7.3%
6.66%
3.57%
卷积层数
5
16
21
151
模型参数
60M
500M
7M
25M
从整体趋势来看,准确度越来越高,同时网络层数也越来越多,可以认为网络结构的复杂性带来效果的提高,而模型参数的数量并非越多越好,合适就好,参数数量太多可能会一定程度上导致过拟合问题。
二. 常用数据集
常用的数据训练集如下:
数据集
MNIST
Imagenet
COCO
PASCAL VOC2012
CIFAR-10
CIFAR-100
内容
手写体分类
目标检测、分割和图像语义
目标检测、图像分类
图像分类
大小
12MB
总1400多万张
已标注100万张约1TB
30多万张
40GB
2GB
50,000个训练图像
170MB
类别划分
10
全类别
80种目标
20
10
大家可以根据自己的需要设计网络,也可以考虑在现有成熟网络的基础上做一些修改,当然也需要标注大量的数据,靠谱的做法是开发个自动标注工具,收集训练样本!
下载地址:MNIST:
ImageNet:
COCO:
VOC:
CIFAR:
三. 其他数据集
其他数据集可以参考作者之前的总结: