TensorFlow:实战Google深度学习框架第二版——第六章

第六章——图像识别与卷积神经网络

6.1 图像识别问题简介及经典数据集

第五章用到的MNIST手写体识别数据集。

CIFAR 数据集就是一个影响力很大的图像分类数据集。CIFAR 数据集分为了 CIFAR-10 和 CIFAR-100 两个问题,它们都是图像词典项目(Visual Dictionary)中 800 万张图片的一个子集。 CIFAR 数据集中的图片为 32×32 的彩色图片,每张图片仅包含一个种类的物体。

 CIFAR-10 问题收集了来自 10 个不同种类的 60000 张图片。和 MNIST 相比, CIFAR 数据集最大的区别在于图片由黑白变成的彩色, 且分类的难度也相对更高。CIFAR 官网 ht叩s://www.cs.toronto.edu/~kriz/ cifar.html 提供了不同格式的 CIF1忧 数据集下载, 具体的数据格式这里不再赘述。

无论是 MNIST 数据集还是 CIFAR 数据集,相比真实环境下的图像识别问题, 有 2 个 最大的问题。第一,现实生活中的图片分辨率要远高于 32× 32,而且图像的分辨率也不会 是同定的。第二,现实生活中的物体类别很多,无论是 10 种还是 100 种都远远不够,而且 一张图片中不会儿出现一个种类的物体。为了更加贴近真实环境下的图像识别问题,由斯 坦福大学(Stanford University)的李飞飞(Feifei Li)教授带头整理的 ImageNet 很大程度 地解决了这两个问题。 

ImageNet 是一个基于 WordNet®的大型图像数据库。在 ImageNet 中,将近 1500 万图片 被关联到了 WordNet 的大约 20000 个名词同义词集上。目前每一个与 ImageNet 相关的 WordNet 同义词集都代表了现实世界中的一个实体,可以被认为是分类问题中的一个类别。ImageNet 中的图片都是从互联网上爬取下来的,井且通过亚马逊的人工标注服务(Amazon Mechanical Turk)将图片分类到 WordNet 的同义词集上。 在 ImageNet 的图片中, 一张图片中可能出现多个同义词集所代表的实体。 

在物体识别问题中 , 一般将用于框出实体的矩形称为 bounding box

ImageNet 每年都举办图像识别相关的竞赛 ClmageNet Large Scale Visual Recognition Challenge, ILSVRC),而且每年的竞赛都会有一些不同的问题,这些问题基本涵盖了图像识别的主要研究方向。 ImageNet 的官网 http://www.image-net.org/challenges/LSVRC 列出了历届 ILSVRC 竞赛的题目和数据集。不同年份的 ImageNet 比赛提供了不同的数据集,本书 将着重介绍使用得最多的 ILSVRC2012 图像分类数据集。 

注:ImageNet数据集中根据任务种类不同有不同的数据集,这里主要使用的是分类数据集。

top-N 正确率指 的是图像识别算法给出前 N 个答案中有一个是正确的概率。在图像分类问题上,很多学术论文都将前 N 个答案的正确率作为比较的方法,其中 N 的取值一般为 3 或 5。


6.2 卷积神经网络简介

第五章使用的神经网络是全连接神经网络,所使用的是FC全连接层。即相邻两层之间各个节点之间都有连接。

一般有三种网络:全连接神经网络,卷积神经网络(CNN),循环神经网络(RNN)

对于卷积神经网络,相邻两层之间只有部分节点相连,为了展示每

  • 1
    点赞
  • 2
    收藏
    觉得还不错? 一键收藏
  • 1
    评论
每天前100人再送5门编程课! AI+5门300元课程+社群闭门分享会源码开源下载:https://github.com/DjangoPeng/keras-101/tree/master/code_samples 【为什么学AI】 归功于近年来大规模数据和硬件计算能力的大幅度提升,人工智能的概念近两年一直是市场追捧的对象。目前各大厂都争先恐后地布局AI,落地各类AI的的商业应用,也随之打响了一场激烈的人才争夺战。长远来看,越快将 AI 用于自己的工作中就能越早体会到AI带来的收益。 【讲师介绍】 彭靖田 Google Developer Experts。 曾为 TensorFlow Top级 的贡献者,著书《深入理解TensorFlow》,是国内第一本深度剖析 Google AI 框架的畅销书。 曾从0到1深入参与了华为 2012 实验室深度学习平台和华为深度学习云服务的设计与研发工作。 【课程设计】 课程内容基于最新的Keras版本(你也可以使用 TensorFlow 2 的 tf.keras 模块),其中有大量独家解读、案例,以及不少讲师一线实战多年的方法论和深度思考。同时,在层次划分上,难易兼顾,循序渐进。既有核心的基础知识,也有高级的进阶操作,尽量做到“老少皆宜”。 课程分为基础篇、入门篇和实战篇: 一、基础篇: 主要讲解人工智能发展史和深度学习脱颖而出的原由,以及神经网络的基础概念、理论实现、优化原理和计算方法。 二、入门篇: 主攻快速上手,通过7个小节让你从0到1实现环境搭建、模型优化,直接试水2个实战项目。同时,增强AI的理论学习,系统掌握机器学习3大分支、模型评估方法、数据预处理常用手段与过拟合问题的解决方案。 三、实战篇: 通过4个实战全面掌握深度学习理论与实现,涵盖目标检测、图像分类、可视化和可解释性学习、迁移学习、特征提取、数据增强等。带你综合运用前面所学的所有知识,逐渐熟练AI开发流程与技能。 课程包含思维导图上的所有内容(价值199元)前500名立减100元,仅99元买完就能学!

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值