[PyTorch][chapter31][卷积]

最新推荐文章于 2024-02-28 16:40:51 发布

明朝百晓生

最新推荐文章于 2024-02-28 16:40:51 发布

阅读量510

点赞数

文章标签： cnn 深度学习人工智能

4AM_明朝百晓生

本文链接：https://blog.csdn.net/chengxf2/article/details/130510624

版权

前言：

卷积神经网络是计算机视觉里面应用非常广泛的一个模型。

卷积神经网络成功案例人脸识别,指纹识别等应用.

卷积的本质是图像的特征提取，在冈萨雷士版本《数字图像处理》处理有专门的章节讲解

各种卷积核，在通讯原理里面，卷积主要用于数字信号调制成模拟信号,信号采样。

卷积神经网络的特征提取思想跟传统的数字图像处理里面的SURF,SIFT 算法很像。

1：图片表示

2： 80年代DNN 问题 what's wrong with Linear

3：感受野 Receptive Field

4：卷积核

一图片表示

我们常处理的图片分为RGB 图片和黑白图片。

1.1 黑白图片

MINIST手写数字识别

28*28 的Martix,矩阵里面的元素取值范围 0-255，代表对应位置的像素点的灰度值。

可以通过图像二值化算法把该值变换为0-1范围内

1.2 彩色图片

如常用的RGB 图像

如果忽略alpha 通道，剩余3个通道 R, G,B

Python 有Image 库可以操作该图像，具体如下示例

# -*- coding: utf-8 -*-
"""
Created on Fri May  5 16:37:52 2023

@author: chengxf2
"""

from PIL import Image

img = Image.open("D:\\AI\\img\\1.jpg")

#返回两个元素，宽和高。im.size ⇒ (width, height)
width, height = img.size[0],img.size[1]
im2 = Image.new("RGB",img.size, "white")

for h in range(height):
    for w in range(width):
        #返回给定位置的像素
         pix = img.getpixel((w,h))
         #修改给定位置的像素
         r,g,b = pix[0],pix[1],pix[2]
         if r>125 and r-20>g and r-20>b:
             im2.putpixel((w,h),(r,0,0))

im2.show()

二 80年代DNN 问题 what's wrong with Linear

问题：参数量太大

这里重点介绍一下CNN 诞生的原因

以MNITST 手写数字识别，输入数据为28*28=784的一张图像

常用如下的DNN结构，进行识别处理（下图少画了一个隐藏层）