人工智能基础作业_7

最新推荐文章于 2024-05-27 16:46:38 发布

无所畏惧monkey

最新推荐文章于 2024-05-27 16:46:38 发布

阅读量106

点赞数 1

文章标签：人工智能计算机视觉深度学习

本文链接：https://blog.csdn.net/qq_29149761/article/details/130513446

版权

卷积

一个矩阵和另一个矩阵对应相乘相加，得到一个值的过程。积就是相乘，卷就是把每个得出的乘积像吃说手抓饼一样卷到一快，就是求和。卷积就是把矩阵对应位置元素相乘再整体求和。常用来图像处理和自然语言处理等。

卷积核

卷积核本质是一个方阵。不同的卷积核有不同的参数，也可以理解成每个位置对应的权重。在运算过程中卷积核需要按照某一指定步长进行滑动，再进行计算。常见的卷积核有垂直、水平、对角线卷积核、高斯卷积核等。

多通道

多个卷积过程同时进行，再把最后的多个矩阵对应相加得到一个矩阵的过程。举个例子，一张图片可以理解为红绿蓝在平面上的堆积，那对图片的卷积就可以分别由红绿蓝三条路进行卷积，最后再把得出的三个矩阵对应相加就可以了。“条条大路通罗马”的哲学思想与多通道基本一致，本人就简记为殊途同归

特征图

卷积之后得到的结果，从该图中可以直观看到卷积后的权重，方便观察特征。

特征选择

从特征图中选择想要的特征。在不同卷积核中不同位置有不同的权重，因为卷积核的确定，所以卷积核的特征会从局部映射到整体。所以针对不同的特征需求，我们需要选择不同的卷积核。

探究不同卷积核的作用，研究背后的原理

不同的卷积核有不同的大小，参数，层数对应通道数。卷积核的不同权重可以有效突出需求特征值，卷积核的大小和步长也能影响最终的特征信息，卷积核越大，特征越泛化；卷积核越小，特征越精化；步长越大，特征数据越少，步长越小特征数据越多；卷积核大小也对卷积效率有所影响。根据这些特征值的不一样，可以在CNN全连接层中被分类成各种物品。
不同的卷积核也被应用于不同的场景，比如面部识别，数字图像处理，物体识别等，猜测的话，京东和淘宝等的拍照识图也用的这种思想。

编程实现：灰度图的边缘检测、锐化、模糊。

这是边缘检测：

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'Fun.jpg'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[-1, -1, -1],
                         [-1, 8, -1],
                         [-1, -1, -1]], dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()

代码运行结果：

边缘检测
锐化：（把卷积核换一下即可）

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'Fun.jpg'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[0, -1, 0],
                         [-1, 5, -1],
                         [0, -1, 0]], dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()

运行结果：
在这里插入图片描述
模糊：

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'Fun.jpg'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[1, 2, 1],
                         [2, 4, 2],
                         [1, 2, 1]], dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()

sobel：

import numpy as np
import torch
from torch import nn
from torch.autograd import Variable
from PIL import Image
import matplotlib.pyplot as plt

plt.rcParams['font.sans-serif'] = ['SimHei']  # 用来正常显示中文标签
plt.rcParams['axes.unicode_minus'] = False  # 用来正常显示负号 #有中文出现的情况，需要u'内容
# https://blog.csdn.net/weixin_40123108/article/details/83510592
file_path = 'Fun.jpg'
im = Image.open(file_path).convert('L')  # 读入一张灰度图的图片
im = np.array(im, dtype='float32')  # 将其转换为一个矩阵
print(im.shape[0], im.shape[1])
plt.imshow(im.astype('uint8'), cmap='gray')  # 可视化图片
plt.title('原图')
plt.show()

im = torch.from_numpy(im.reshape((1, 1, im.shape[0], im.shape[1])))
conv1 = nn.Conv2d(1, 1, 3, bias=False)  # 定义卷积

sobel_kernel = np.array([[-1, 0, 1],
                        [-2, 0, 2],
                        [-1, 0, 1]]
                            , dtype='float32')  # 定义轮廓检测算子
sobel_kernel = sobel_kernel.reshape((1, 1, 3, 3))  # 适配卷积的输入输出
conv1.weight.data = torch.from_numpy(sobel_kernel)  # 给卷积的 kernel 赋值

edge1 = conv1(Variable(im))  # 作用在图片上

x = edge1.data.squeeze().numpy()
print(x.shape)  # 输出大小

plt.imshow(x, cmap='gray')
plt.show()

在这里插入图片描述

无所畏惧monkey

关注

1
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
人工智能基础作业_7

不同的卷积核有不同的大小，参数，层数对应通道数。卷积核的不同权重可以有效突出需求特征值，卷积核的大小和步长也能影响最终的特征信息，卷积核越大，特征越泛化；举个例子，一张图片可以理解为红绿蓝在平面上的堆积，那对图片的卷积就可以分别由红绿蓝三条路进行卷积，最后再把得出的三个矩阵对应相加就可以了。在不同卷积核中不同位置有不同的权重，因为卷积核的确定，所以卷积核的特征会从局部映射到整体。不同的卷积核也被应用于不同的场景，比如面部识别，数字图像处理，物体识别等，猜测的话，京东和淘宝等的拍照识图也用的这种思想。
复制链接

扫一扫