人工智能作业4

r02～

已于 2022-05-16 14:52:06 修改

阅读量659

点赞数 1

分类专栏： AI 文章标签：人工智能深度学习计算机视觉

于 2022-05-16 14:38:18 首次发布

本文链接：https://blog.csdn.net/m0_53678120/article/details/124793147

版权

AI 专栏收录该内容

6 篇文章 0 订阅

订阅专栏

卷积

一、卷积有关概念
二、不同卷积核的作用
三、编程实现
四、总结

一、卷积有关概念

1.卷积
其本质上是一种互相关函数计算或者是图像处理中的空间滤波器请添加图片描述
数学中卷积，主要是为了诸如信号处理、求两个随机变量和的分布等而定义的运算，所以需要“翻转”是根据问题的需要而确定的
卷积神经网络中“卷积”，是为了提取图像的特征，其实只借鉴了“加权求和”的特点
另外数学中的“卷积核”都是已知的或者给定的，卷积神经网络中“卷积核”本来不是给定的，是根据数据训练学习的。
2.卷积核
其实就是一个矩阵，它的作用就是提取特征，不同卷积核提取的特征不同，网络训练的目的就是提高卷积核提取特征的能力。
3.多通道
对多通道图像进行卷积需要使用与图像图像相同的卷积核进行卷积，卷积核的每个通道对应着图像中相应的通道图像，一对一卷积，最后将每个通道的卷积后图像对应位置的卷积值相加，得到一个1通道的特征图。
多通道卷积结果的通道数==卷积核数
请添加图片描述
4.特征图
卷积的到的结果就是特征图
5.特征选择
不同卷积核可用来刻画不同选择性，要根据想要提取的图像特征选择不同的卷积核。

二、不同卷积核的作用

1.边缘检测
在这里插入图片描述
因为用这个滤波器卷积相当于求导的离散版本，将当前的像素值减去前一个像素值得到这个函数在这两个位置的差别或者斜率。
2.锐化

实际上就是计算当前点和周围点的差别，然后将这个差别加到原来的位置上，使对比度增加，图像更加清晰锐利。
3.模糊
在这里插入图片描述
模糊就是使点之间的对比度变小，将像素值调整为与周围点像素值近似的值。

三、编程实现

程序代码

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
import torch.nn.functional as F
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容

file_path = '1.jpg'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()

在这里插入图片描述
（1）边缘检测

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子

在这里插入图片描述
（2）锐化

sobel_kernel = np.array([[0, -1, 0],
                         [-1, 5, -1],
                         [0, -1, 0]], dtype='float32')  # 卷积核

在这里插入图片描述
（3）模糊

sobel_kernel = np.array([[0.0625, 0.125, 0.0625],
                         [0.125, 0.25, 0.125],
                         [0.0625, 0.125, 0.0625]], dtype='float32')  # 卷积核

（4）调整经典卷积核参数
1、边缘检测中心权重越低，图像对边缘的检测效率越低
在这里插入图片描述
2.锐化周围的权重越低，锐化程度越大

3.模糊周围像素权重越大，模糊程度越大

（5）
使用不同分辨率图片，边缘检测不同

有点不太清晰
（6）探索更多类型卷积核
浮雕：

sobel_kernel = np.array([[-2, -1, 0],
                         [-1, 1, 1],
                         [0, 1, 2]], dtype='float32')  # 定义轮廓检测算子

在这里插入图片描述
（7）
彩色图片边缘检测

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
import torch.nn.functional as F
from PIL import Image
import matplotlib.pyplot as plt
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'p.png'
im = Image.open(file_path)  # 读入一张的图片
im = np.array(im, dtype='float32')  
print(im.shape[0], im.shape[1])
im=np.transpose(im,(2,1,0))
im=im[np.newaxis,:]
conv1 = nn.Conv2d(3, 3, 3, bias=False)  # 定义卷积
sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')/3  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
sobel_kernel=np.repeat(sobel_kernel,3,axis=1)#数组，次数，维度
sobel_kernel=np.repeat(sobel_kernel,3,axis=0)
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(torch.from_numpy(im)))  # 作用在图片上
x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小
x=np.transpose(x,(2,1,0))
plt.imshow(x, cmap='gray')
plt.title('彩色')
plt.show()