神经网络高维空间的理解

最新推荐文章于 2023-10-31 17:39:33 发布

normol

最新推荐文章于 2023-10-31 17:39:33 发布

阅读量4k

点赞数 2

分类专栏：计算机视觉 Python 深度学习文章标签：高维数组 one-hot 神经网络分割 numpy

本文链接：https://blog.csdn.net/normol/article/details/89034225

版权

计算机视觉同时被 3 个专栏收录

26 篇文章 66 订阅

订阅专栏

Python

17 篇文章 5 订阅

订阅专栏

深度学习

14 篇文章 7 订阅

订阅专栏

首先，先看一下在分割问题中，最常见的one-hot编码直观上是如何进行的，以及是怎样进行preds的
下图（图一），是常见的ground-truth分割图，一共有两个类别（背景可以作为0，不单独作为一个类别）
在这里插入图片描述
如果想进行cross-entropy计算损失函数等，就需要对图一的label进行one-hot编码，直观上会变成下图所示（图二）

然后，我们的图片经过神经网络，训练好之后，输出的预测值就会如下图所示（图三）

那么下面，假设有两个class，然后图片的格式是(2,3)即height=rows=2，width=cols=3。
根据一般dense prediction，输出格式类似于：(batch_size, 2, 3, 2)
下面为了简便，省略batch_size这个维度，变成（2，3，2）
假设图片在class0与class1上的预测值分别为

#preds values at class0
0.1 0.3 0.1
0.2 0.4 0.1
# preds values at class1
0.2 0.2 0.1
0.5 0.1 0.1

现在的要求是，手写出(2,3,2)的结果，我最开始写的是：

test1 = np.array([[[0.1,0.3,0.1],[0.2,0.4,0.1]],[[0.2,0.2,0.1],[0.5,0.1,0.1]]])

但是，test1.shape:(2,2,3)，显然有问题。
那么，（2，3，2）怎么来？

mat1 = np.array([[0.1,0.3,0.1],[0.2,0.4,0.1]])
mat1 = np.expand_dims(mat1,axis=-1)
mat2 = np.array([[0.2,0.2,0.1],[0.5,0.1,0.1]])
mat2 = np.expand_dims(mat2,axis=-1)
mat3 = np.concatenate((mat1,mat2),axis=2)
"""
mat3
Out[91]: 
array([[[0.1, 0.2],
        [0.3, 0.2],
        [0.1, 0.1]],

       [[0.2, 0.5],
        [0.4, 0.1],
        [0.1, 0.1]]])
"""