百度深度学习--图像中物体边缘检测

最新推荐文章于 2024-08-16 08:58:50 发布

W_Y_J_love

最新推荐文章于 2024-08-16 08:58:50 发布

阅读量1.8k

点赞数

分类专栏：深度学习文章标签：卷积 python 计算机视觉深度学习

本文链接：https://blog.csdn.net/W_Y_J_love/article/details/105498048

版权

深度学习专栏收录该内容

21 篇文章 2 订阅

订阅专栏

案例2——图像中物体边缘检测

上面展示的是一个人为构造出来的简单图片使用卷积检测明暗分界处的例子，对于真实的图片，也可以使用合适的卷积核对它进行操作，用来检测物体的外形轮廓，观察输出特征图跟原图之间的对应关系，如下代码所示：

import matplotlib.pyplot as plt
from PIL import Image
import numpy as np
import paddle  # 下面是百度飞浆框架所需要的库
import paddle.fluid as fluid
from paddle.fluid.dygraph import Conv2D
from paddle.fluid.initializer import NumpyArrayInitializer

img = Image.open('../work/images/section1/000000098520.jpg')  # 图片存放的路径

with fluid.dygraph.guard():
    # 设置卷积核参数
    w = np.array([[-1,-1,-1], [-1,8,-1], [-1,-1,-1]], dtype='float32')/8
    w = w.reshape([1, 1, 3, 3])
    # 由于输入通道数是3，将卷积核的形状从[1,1,3,3]调整为[1,3,3,3]
    w = np.repeat(w, 3, axis=1)
    # 创建卷积算子，输出通道数为1，卷积核大小为3x3，
    # 并使用上面的设置好的数值作为卷积核权重的初始化参数
    # num_channels=3(RGB)  num_filters=1输出一张灰度图
    conv = Conv2D(num_channels=3, num_filters=1, filter_size=[3, 3],
                 param_attr=fluid.ParamAttr(
                     initializer=NumpyArrayInitializer(value=w)))
    # 将读入的图片转化为float32类型的numpy.ndarray
    x = np.array(img).astype('float32')
    # 图片读入成ndarry时，形状是[H, W, 3]，
    # 将通道这一维度调整到最前面
    x = np.transpose(x, (2,0,1))
    # 将数据形状调整为[N, C, H, W]格式
    x = x.reshape(1, 3, img.height, img.width)
    x = fluid.dygraph.to_variable(x)
    y = conv(x)
    out = y.numpy()
    
plt.figure(figsize=(20, 10))
f = plt.subplot(121)
f.set_title('input image', fontsize=15)
plt.imshow(img)
f = plt.subplot(122)
f.set_title('output feature map', fontsize=15)
plt.imshow(out.squeeze(), cmap='gray')
plt.show()