人工智能作业4

weixin_51212297

已于 2022-05-20 15:30:22 修改

阅读量383

点赞数 1

文章标签：人工智能深度学习计算机视觉

于 2022-05-20 15:29:07 首次发布

本文链接：https://blog.csdn.net/weixin_51212297/article/details/124740966

版权

一、简单描述卷积、卷积核、多通道、特征图、特征选择概念。

卷积：
是通过两个函数f和g生成第三个函数的一种数学运算，表征函数f与g经过翻转和平移的重叠部分的面积。

数学表达式：
在这里插入图片描述

卷积核：
和滤波器所指的是同一个东西，但是在传统图像处理一般叫滤波器，而在深度学习中叫卷积核。
多通道：
例如三通道就是RGB三原色的，一幅完整的图像，是由红绿蓝三个通道组成的，他们共同作用产生了完整的图像
特征图：由图像提取出的特征值组成的方图

特征选择：
从已经有的特征中选择若干有效的特征使图片最优

二、不同卷积核的作用
1.边缘检测
在这里插入图片描述

因为用这个滤波器卷积相当于求导的离散版本，将当前的像素值减去前一个像素值得到这个函数在这两个位置的差别或者斜率。
2.锐化
在这里插入图片描述

实际上就是计算当前点和周围点的差别，然后将这个差别加到原来的位置上，使对比度增加，图像更加清晰锐利。
3.模糊
在这里插入图片描述

模糊就是使点之间的对比度变小，将像素值调整为与周围点像素值近似的值。
三、编程实现
（1）经典

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
import torch.nn.functional as F
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容

file_path = 'cc.cng'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()

在这里插入图片描述
1.边缘检测

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子

在这里插入图片描述

2.锐化

sobel_kernel = np.array([[0, -1, 0],
                         [-1, 5, -1],
                         [0, -1, 0]], dtype='float32')  # 卷积核

在这里插入图片描述
3.模糊

sobel_kernel = np.array([[0.0625, 0.125, 0.0625],
                         [0.125, 0.25, 0.125],
                         [0.0625, 0.125, 0.0625]], dtype='float32')  # 卷积核

（2）调整卷积核参数
1.边缘检测中心权重越低，图像对边缘的检测效率越低
在这里插入图片描述
2.锐化周围的权重越低，锐化程度越大

3.模糊周围像素权重越大，模糊程度越大

（3)使用不同尺寸图片，边缘检测不同

（4）探索更多类型卷积核
浮雕：

sobel_kernel = np.array([[-2, -1, 0],
                         [-1, 1, 1],
                         [0, 1, 2]], dtype='float32')

在这里插入图片描述
（5）彩色图片边缘检测

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
import torch.nn.functional as F
from PIL import Image
import matplotlib.pyplot as plt
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'c.png'
im = Image.open(file_path)  # 读入一张的图片
im = np.array(im, dtype='float32')  
print(im.shape[0], im.shape[1])
im=np.transpose(im,(2,1,0))
im=im[np.newaxis,:]
conv1 = nn.Conv2d(3, 3, 3, bias=False)  # 定义卷积
sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')/3  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
sobel_kernel=np.repeat(sobel_kernel,3,axis=1)#数组，次数，维度
sobel_kernel=np.repeat(sobel_kernel,3,axis=0)
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(torch.from_numpy(im)))  # 作用在图片上
x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小
x=np.transpose(x,(2,1,0))
plt.imshow(x, cmap='gray')
plt.title('彩色')
plt.show()

在这里插入图片描述

weixin_51212297

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
人工智能作业4

一、简单描述卷积、卷积核、多通道、特征图、特征选择概念。卷积：是通过两个函数f和g生成第三个函数的一种数学运算，表征函数f与g经过翻转和平移的重叠部分的面积。数学表达式：卷积核：和滤波器所指的是同一个东西，但是在传统图像处理一般叫滤波器，而在深度学习中叫卷积核。多通道：例如三通道就是RGB三原色的，一幅完整的图像，是由红绿蓝三个通道组成的，他们共同作用产生了完整的图像特征图：由图像提取出的特征值组成的方图特征选择：从已经有的特征中选择若干有效的特征使图片最优二、探究不同卷积核的作用，
复制链接

扫一扫