徐海蛟教学
一直以来,计算科学家在为建立世界上最精确的计算机视觉系统孜孜不倦地努力着,但取得进展的过程却一直如马拉松竞赛般漫长而艰辛。斯坦福大学每年都会举行一个比赛 ILSVR ,邀请谷歌、微软、百度等IT企业使用ImageNet —— 全球最大的图像识别数据库,测试他们的系统运行情况。每年一度的比赛也牵动着各大巨头公司的心弦,过去几年中,系统的图像识别功能大大提高,ImageNet 2012分类数据集中的错误率已降低至4.94%。而此前同样的实验中,人眼辨识的错误率大概为5.1%。在比赛 ILSVR中,比赛数据集包含约120万张训练图像、5万张验证图像和10万张测试图像,分为1000个不同的类别。
VGG-16 是视觉几何组(Visual Geometry Group)开发的卷积神经网络结构,该深度学习神经网络赢得了ILSVR(ImageNet)2014的冠军,时至今日,VGG仍然被认为是一个杰出的视觉模型。今天,我们来做基于 VGG16 深度学习预训练权重的图像分类预测实验,我们无需自己训练神经网络权重参数,使用VGG-16已经训练好的模型与权重参数来预测图片的类别。
我们考虑基于Keras深度学习框架来完成该实验,仅