数据集可视化——tile（"贴砖"）

最新推荐文章于 2023-03-08 10:33:16 发布

五道口纳什

最新推荐文章于 2023-03-08 10:33:16 发布

阅读量4.6k

点赞数 1

分类专栏：可视化

本文链接：https://blog.csdn.net/lanchunhui/article/details/50251293

版权

可视化专栏收录该内容

53 篇文章 3 订阅

订阅专栏

在大量的数据处理或者计算机视觉的文献和著作中，我们常见如下的数据集可视化（甚至对参数也可进行可视化，毕竟图像的本质是二维数组），通过文章末尾的代码我们发现只需对布局及间距的慎重设置，便可对大量丰富的图像以”地板贴砖（tiles on a floor）”的形式进行组织，也即可视化，展示数据或相关工作，可以起到十分直观的效果，下图即是对深度神经网络的权值矩阵进行的贴砖可视化：

def normalize(darr, eps=1e-8):
    # normalize(x) = (x-min)/(max-min)
    darr -= darr.min()
    darr *= 1./(darr.max()+eps)
    return darr

def tile_raster_images(X, image_shape, tile_shape, 
            tile_spacing=(0, 0), normalize_rows=True, output_pixel_vals=True):
            # image_shape：每一个砖的高和宽，
            # tile_shape：在横纵两个方向上分别有多少砖
            # tile_spacing：砖与砖之间的距离
            # normalize_rows：是否对砖进行归一化
            # output_pixel_vals：是否对砖以图像的形式进行显示

    assert len(image_shape) == 2
    assert len(tile_shape) == 2
    assert len(tile_spacing) == 2
                            # 对参数进行断言，确保它们都是二维元组
    output_shape = [
        (ishp + tsp)*tshp-tsp
        for ishp, tshp, tsp in zip(image_shape, tile_shape, tile_spacing)
    ]
                    # image_shape == (28, 28)   mnist data
                    # tile_shape == (10, 10), tile_spacing == (1, 1)
                    # [(28+1)*10-1]*[(28+1)*10-1]                   

    H, W = image_shape
    Hs, Ws = tile_spacing
    dt = 'uint8' if output_pixel_vals else X.dtype
                            # python 风格的三目运算符
    output_array = numpy.zeros(output_shape, dtype=dt)

    # 开始贴砖
    for i in range(tile_shape[0]):
        for j in range(tile_shape[1]):
            if i*tile_shape[1]+j < X.shape[0]:
                    # X的每一行是一个图像（二维）flatten后的（一维的行向量）
                this_x = X[i*tile_shape[1]+j]
                this_image = normalize(this_x.reshape(image_shape)) if normalize_rows else this_x.reshape(image_shape)
                c = 255 if output_pixel_vals else 1
                output_array[
                    i*(H+Hs):i*(H+Hs)+H, j*(W+Ws):j*(W+Ws)+W
                ] = this_image*c
    return output_array

客户端调用：

import numpy
from PIL import Image

X = numpy.random.randn(500, 28*28)
arr = tile_raster_images(X, image_shape=(28, 28), 
            tile_shape=(12, 12), tile_spacing=(1, 1))
img = Image.fromarray(arr)
img.show()
img.save('./tiles.png')
    # 这里也可使用 matplotlib 进行显示
    # plt.imshow(img, cmap='gray')
    # plt.show()