百度深度学习--卷积算子的应用(一)

卷积算子应用举例

下面介绍卷积算子在图片中应用的三个案例,并观察其计算结果。

案例1——简单的黑白边界检测

下面是使用Conv2D算子完成一个图像边界检测的任务。图像左边为光亮部分,右边为黑暗部分,需要检测出光亮跟黑暗的分界处。
可以设置宽度方向的卷积核为 [ 1 , 0 , − 1 ] [1, 0, -1] [1,0,1],此卷积核会将宽度方向间隔为1的两个像素点的数值相减。当卷积核在图片上滑动的时候,如果它所覆盖的像素点位于亮度相同的区域,则左右间隔为1的两个像素点数值的差为0。只有当卷积核覆盖的像素点有的处于光亮区域,有的处在黑暗区域时,左右间隔为1的两个点像素值的差才不为0。将此卷积核作用到图片上,输出特征图上只有对应黑白分界线的地方像素值才不为0。具体代码如下所示,结果输出在下方的图案中。

import matplotlib.pyplot as plt

import numpy as np
import paddle
import paddle.fluid as fluid
from paddle.fluid.dygraph import Conv2D
from paddle.fluid.initializer import NumpyArrayInitializer
%matplotlib inline

with fluid.dygraph.guard():
    # 创建初始化权重参数w
    w = np.array([1, 0, -1], dtype='float32')
    # 将权重参数调整成维度为[cout, cin, kh, kw]的四维张量
    w = w.reshape([1, 1, 1,3])
    # 创建卷积算子,设置输出通道数,卷积核大小,和初始化权重参数
    # filter_size = [1, 3]表示kh = 1, kw=3
    # 创建卷积算子的时候,通过参数属性param_attr,指定参数初始化方式
    # 这里的初始化方式时,从numpy.ndarray初始化卷积参数
    # num_channels=1输入图像的通道数为1(表示为灰度图)
    # num_filters=1,表示只有一个卷积核,每张图片都是使用相同的卷积核进行计算,
    conv = Conv2D(num_channels=1, num_filters=1, filter_size=[1, 3],
                 param_attr=fluid.ParamAttr(initializer=NumpyArrayInitializer(value=w)))
    
    # 创建输入图片,图片左边的像素点取值为1,右边的像素点取值为0
    img = np.ones([50, 50], dtype='float32')
    img[:, 30:] = 0.
    # 将图片形状调整为[N, C, H, W]的形式,N输入几张图片,C图片的输入通道数(灰度图为1)
    x = img.reshape([1, 1, 50, 50])
    # 将numpy.ndarray转化成paddle中的tensor
    x = fluid.dygraph.to_variable(x)
    # 使用卷积算子作用在输入图片上
    y = conv(x)
    out = y.numpy()
    
f = plt.subplot(121)
f.set_title('input image', fontsize=15)
plt.imshow(img, cmap='gray')

f = plt.subplot(122)
f.set_title('output featuremap', fontsize=15)
# 卷积算子Conv2D输出数据形状为[N, C, H, W]形式
# 此处N, C=1,输出数据形状为[1, 1, H, W],是4维数组
# 但是画图函数plt.imshow画灰度图时,只接受2维数组
# 通过numpy.squeeze函数将大小为1的维度消除
plt.imshow(out.squeeze(), cmap='gray')
plt.show()

运行结果
在这里插入图片描述

# 查看卷积层参数
with fluid.dygraph.guard():
    # 通过 conv.parameters()查看卷积层的参数,返回值是list,包含两个元素,一个是权重参数,一个是偏置参数
    print(conv.parameters())
    # 查看卷积层的权重参数名字和数值
    print(conv.parameters()[0].name, conv.parameters()[0].numpy())
    # 参看卷积层的偏置参数名字和数值
    print(conv.parameters()[1].name, conv.parameters()[1].numpy())

打印结果
[name conv2d_0.w_0, dtype: VarType.FP32 shape: [1, 1, 1, 3] lod: {}
dim: 1, 1, 1, 3
layout: NCHW
dtype: float
data: [1 0 -1]
, name conv2d_0.b_0, dtype: VarType.FP32 shape: [1] lod: {}
dim: 1
layout: NCHW
dtype: float
data: [0]
]
conv2d_0.w_0 [[[[ 1. 0. -1.]]]]
conv2d_0.b_0 [0.]

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值