TensorFlow学习笔记之五（卷积神经网络)

最新推荐文章于 2022-12-19 17:00:00 发布

今夜星光如雨

最新推荐文章于 2022-12-19 17:00:00 发布

阅读量235

点赞数 1

分类专栏：深度学习

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/u012881002/article/details/97758476

版权

文章目录

1. 图片识别问题简介以及经典数据集

1.1 图片识别问题简介

视觉是人类认识世界非常重要的一种知觉。对于人来说，通过视觉来识别手写体数字、识别图片中的物体或者找出图片中人脸的轮廓都是非常简单的任务。但是这对于计算机来说不是一件简单的事情。

图片识别问题希望借助计算机中的程序来处理、分析和理解图片中的内容，使得计算机可以从图片中识别各种不同模式的目标和对象。比如前面的MNIST联系就是通过计算机来识别图片中的手写体数字。

1.2 经典数据集

MNIST数据集：TensorFlow入门数据集

CIFAR ：CIFAR数据集是一个影响力很大的图像分类数据集。分为CIFAR-10和CIFAR-100两个问题，它们都是图像字典项目(Visual Dictionary)中800万张图片中的一个子集。CIFAR数据集中的图片是32*32的彩色图片。

ImageNet：
无论是MNIST还是CIFAR数据集，相比真实环境有两个最大的问题：

现实生活中的图片分辨率要远高于32*32，而且图像的分辨率也不会是固定的。
现实生活中的物体类别很多，无论是10中还是100种都远远不够，而且一张图片中不会只出现一个种类的物体。

为了更加贴近真实环境下的图像识别问题，由斯坦福大学的李飞飞教授带头整理的ImageNet很大程度地解决了这两个问题。

ImageNet是一个基于WordNet的大型图像数据库。

目标：抽取一个32323的图片的特征，再将提取的特征喂入到全连接网络。

卷积可以认为是一种有效提取图像特征的方法。
一般会用一个正方形的卷积核，遍历图片上的每个像素点。图片内的每个像素点，乘以卷积核上相对应的点的权重，求和，在加上偏置。

1. 单通道图片求卷积

1.1 基本的图片求卷积

现在对于一个551的图片，用一个331的卷积核求卷积。
在这里插入图片描述
如图所示，计算机会将一张551图片转换为一个55的矩阵，矩阵中的每个值代表其像素点的灰度。现在用一个33的矩阵对其求卷积。
每次求卷积的过程为拿着卷积核在原始图片举证上求卷积。如图中所示，就是
$1 * (- 1) + 0 * <$

最低0.47元/天解锁文章

今夜星光如雨

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
TensorFlow学习笔记之五（卷积神经网络)

目标：抽取一个32323的图片的特征，再将提取的特征喂入到全连接网络。卷积可以认为是一种有效提取图像特征的方法。一般会用一个正方形的卷积核，遍历图片上的每个像素点。图片内的每个像素点，乘以卷积核上相对应的点的权重，求和，在加上偏置。1. 单通道图片求卷积1.1 基本的图片求卷积现在对于一个551的图片，用一个331的卷积核求卷积。如图所示，计算机会将一张551图片转换为一个55的...
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。