我们知道VGG,Googlenet,Resnet152可以实现很高的识别准确度,不过实际应用时大部分情况是无法使用这么大的网络的,经常是使用精简后的网络模型,但是精简后往往会发现识别精度迅速下降,给模型设计和调试带来很大不确定性
从常理我们知道,网络越深越复杂,可以拟合的特征越精细,所以Alexnet无法分辨的一些细节特征,例如鸟的嘴长嘴短,或者飞机引擎粗一点还是细一点,Googlenet跟Resnet可以拟合到,对特征刻画的更细致,所以后者网络分类准确性更高。但是这只是理论上如此,具体如何衡量细节的细致化程度?没有公式以及相关理论.......
如何知道每一层网络可以刻画多少目标细节,或者多少层网络可以刻画到目标的本质特征?
如果知道这个的话,那网络识别可靠性就高多了,希望可以找到可以量化的刻画精度。
题外话,如果网络不够复杂,提取的特征比较粗糙,虽然通过其他手段也能在训练集实现很高的准确率,但是泛华能力不好,为什么不好,因为他特征抓的不细,可能只是抓住了部分特征,然后在训练集强行拟合出高准确率。
www.intelvisioncn.com