人工智能作业4

一、简单描述卷积、卷积核、多通道、特征图、特征选择概念。

卷积:
是通过两个函数f和g生成第三个函数的一种数学运算,表征函数f与g经过翻转和平移的重叠部分的面积。

数学表达式:
在这里插入图片描述

卷积核:
和滤波器所指的是同一个东西,但是在传统图像处理一般叫滤波器,而在深度学习中叫卷积核。
多通道:
例如三通道就是RGB三原色的,一幅完整的图像,是由红绿蓝三个通道组成的,他们共同作用产生了完整的图像
特征图:由图像提取出的特征值组成的方图

特征选择:
从已经有的特征中选择若干有效的特征使图片最优

二、不同卷积核的作用
1.边缘检测
在这里插入图片描述

因为用这个滤波器卷积相当于求导的离散版本,将当前的像素值减去前一个像素值得到这个函数在这两个位置的差别或者斜率。
2.锐化
在这里插入图片描述

实际上就是计算当前点和周围点的差别,然后将这个差别加到原来的位置上,使对比度增加,图像更加清晰锐利。
3.模糊
在这里插入图片描述

模糊就是使点之间的对比度变小,将像素值调整为与周围点像素值近似的值。
三、编程实现
(1)经典

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
import torch.nn.functional as F
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况,需要u'内容

file_path = 'cc.cng'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()



在这里插入图片描述
1.边缘检测

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子

在这里插入图片描述

2.锐化

sobel_kernel = np.array([[0, -1, 0],
                         [-1, 5, -1],
                         [0, -1, 0]], dtype='float32')  # 卷积核

在这里插入图片描述
3.模糊
在这里插入图片描述

sobel_kernel = np.array([[0.0625, 0.125, 0.0625],
                         [0.125, 0.25, 0.125],
                         [0.0625, 0.125, 0.0625]], dtype='float32')  # 卷积核

(2)调整卷积核参数
1.边缘检测中心权重越低,图像对边缘的检测效率越低
在这里插入图片描述
2.锐化周围的权重越低,锐化程度越大
在这里插入图片描述
3.模糊周围像素权重越大,模糊程度越大
在这里插入图片描述
(3)使用不同尺寸图片,边缘检测不同
在这里插入图片描述
(4)探索更多类型卷积核
浮雕:

sobel_kernel = np.array([[-2, -1, 0],
                         [-1, 1, 1],
                         [0, 1, 2]], dtype='float32')  

在这里插入图片描述
(5)彩色图片边缘检测

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
import torch.nn.functional as F
from PIL import Image
import matplotlib.pyplot as plt
import os
os.environ["KMP_DUPLICATE_LIB_OK"]="TRUE"

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况,需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'c.png'
im = Image.open(file_path)  # 读入一张的图片
im = np.array(im, dtype='float32')  
print(im.shape[0], im.shape[1])
im=np.transpose(im,(2,1,0))
im=im[np.newaxis,:]
conv1 = nn.Conv2d(3, 3, 3, bias=False)  # 定义卷积
sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')/3  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
sobel_kernel=np.repeat(sobel_kernel,3,axis=1)#数组,次数,维度
sobel_kernel=np.repeat(sobel_kernel,3,axis=0)
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(torch.from_numpy(im)))  # 作用在图片上
x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小
x=np.transpose(x,(2,1,0))
plt.imshow(x, cmap='gray')
plt.title('彩色')
plt.show()

在这里插入图片描述

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值