Python高级编程(深度学习) 04-卷积神经网络图像分类

计算机视觉

  • 眼睛不等于视觉
  • 摄像机不等于视觉
  • 单个像素只有一个颜色信息,不表示任何复杂语义

传统图像特征举例:HOG

  • 方向梯度直方图
  • 在这里插入图片描述

传统图像特征举例:LBP

  • 局部二值模式(以中间的值作为阈值,若像素值高于阈值则设置为1低于则为0)
  • 在这里插入图片描述

图像分类任务

  • 怎么区分鱼和自行车?
  • 有效描述图像内容(像素图像比较无效)
  • 找出区分鱼和自行车的关键信息(比如不能通过鱼有眼睛来区分,自行车上挂一个小黄人也是有眼睛的)
  • 逻辑分类

卷积(Convolution)

  • 对于一个有噪声的函数y=f(x),使用一个核(kernel)函数k(n)对其进行滤波
  • 形象描述:滚动式的加权平均

离散二维卷积

在这里插入图片描述
在这里插入图片描述
计算方法就是3*3的模板一直移动,模板框出来的数字和卷积核对应相乘然后相加得到对应的值,在没有增加padding 的情况下,获得的输出的大小是(width-2,height-2)

  • 图中的卷积核可以用来检测边缘。
  • 对图像进行三维卷积运算,得到特征图。
  • 卷积核是可训练参数。
  • 卷积沟通了临近像素,一二增加了视野。
  • 当图像内容与卷积核形状吻合的时候,激活度会很高,因而是一个特征提取器。
  • 输出特征图的通道数等于使用的卷积核个数。

padding

  • 使用padding可以对图像进行填充,使得卷积后的图像大小不变。

池化

  • 池化是模板在输入图像上不断移动,模板框中的最大像素值输出,最后形成一个矩阵。
  • 在这里插入图片描述

例题:MNIST手写数字识别

用卷积神经网络去构建模型,解决手写数字识别的问题。
这里就放构建模型的部分,如果需要把模型进行识别,用一下predict。

import numpy as np
#import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers


#读取数据
def load_mnist
  • 4
    点赞
  • 26
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

拔牙不打麻药

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值