「Numpy」解析numpy.mean函数对高维数组求均值

背景

复现Retinex算法时看别人代码发现一句:

im_blur[s, :, :, channel] = 这里的代码不重要
np.mean(im_blur, 0)

变量im_blur在这里是一个高维numpy数组,上面的代码对im_blur赋值后又对其某个轴求了平均值。虽然能明白作者的意图,但高位数组加上求平均就给我看得有点懵,特此记录。

np.mean

先来看Numpy官网对mean函数参数的定义:

numpy.mean(a, axis=None, dtype=None, out=None, keepdims=<no value>, *, where=<no value>)

只说本文感兴趣的前两个变量。第一个变量a就不说了;第二个变量axis表示所求平均值对应的轴。

假定存在一个高维np数组a,定义为:

a = np.array([[[[1, 1, 1], [1, 1, 1]],[[2, 2, 2], [2, 2, 2]], [[3, 3, 3], [3, 3, 3]]][[[4, 4, 4], [4, 4, 4]],[[6, 6, 6], [6, 6, 6]], [[8, 8, 8], [8, 8, 8]]]])

显然a是一个形状为[2, 3, 2, 3]的四维数组,那么在np.mean函数的axis参数中,有四个轴可选:axis = 0, 1, 2, 3;如果a为五位数组,那么axis参数有五个轴可选axis = 0, 1, 2, 3, 4;更高维度以此类推。本文以四维上面的四维数组为例:

定义数组a:
在这里插入图片描述
可以看到数组形状为dim_range = (2, 3, 2, 3),形状对应的axis命名为axis = (0, 1, 2, 3)

  • dim_range = 2, axis = 0时,
    在这里插入图片描述
    可以看到求平均后的输出形状正好对应数组a去掉0轴之后的形状,也就是说,此时对数组a求的平均,是将a[0, :, :, :]a[1, :, :, :] 对应位置相加除以元素个数得到的输出,即:
    在这里插入图片描述
    将上图中每个红色矩形框中,两个对应的数组相加除2得到的结果。

  • dim_range = 3, axis = 1时,
    在这里插入图片描述
    可以看到求平均后的输出形状正好对应数组a去掉1轴之后的形状,也就是说,此时对数组a求的平均,是将a[:, 0, :, :]a[: , 1, :, :]a[: , 2, :, :] 对应位置相加除以元素个数得到的输出,即:

在这里插入图片描述
([1, 1, 1] + [2, 2, 2] + [3, 3, 3]) / 3 = [2, 2, 2]

  • dim_range = 2, axis = 2时,
    在这里插入图片描述
    可以看到求平均后的输出形状正好对应数组a去掉2轴之后的形状,也就是说,此时对数组a求的平均,是将a[:, :, 0, :]a[:, :, 1, :] 对应位置相加除以元素个数得到的输出,即:

--------------------------------------20211202更新----------------------------------------
…发现这篇没写完,看了一下上面写的,应该能看懂,就不更了

  • 14
    点赞
  • 27
    收藏
    觉得还不错? 一键收藏
  • 5
    评论
一个高维核密度估计的python程序应该包括以下部分: 1. 数据读取和预处理部分,用于读取数据并对数据进行必要的预处理,如归一化等。 2. 核函数部分,用于计算核函数的值。 3. 高维核密度估计部分,用于计算每个样本点的密度估计值。 4. 可视化部分,用于将密度估计结果可视化。 下面给出这些部分的简单Python程序实现: 1. 数据读取和预处理部分 ```python import numpy as np # 读取数据 data = np.loadtxt('data.txt') # 归一化 data = (data - np.mean(data, axis=0)) / np.std(data, axis=0) ``` 其中,`data.txt`是数据文件,`np.loadtxt`用于读取数据并返回一个numpy数组,`np.mean`和`np.std`分别计算数据的均值和标准差,归一化操作使得数据各维度的均值为0,方差为1。 2. 核函数部分 ```python import numpy as np def gaussian_kernel(x, h): # 高斯核函数 return np.exp(-0.5 * np.sum(x ** 2, axis=1) / h ** 2) / ((2 * np.pi) ** (d / 2) * h ** d) ``` 其中,`x`是一个`N x d`的numpy数组,表示`N`个样本点在`d`维空间中的坐标,`h`是核函数的带宽参数。 3. 高维核密度估计部分 ```python import numpy as np def density_estimation(data, h): N, d = data.shape density = np.zeros(N) for i in range(N): x = data[i, :] density[i] = np.sum(gaussian_kernel(data - x, h)) / N return density ``` 其中,`data`是一个`N x d`的numpy数组,表示`N`个样本点在`d`维空间中的坐标,`h`是核函数的带宽参数,`density`是一个长度为`N`的numpy数组,表示每个样本点的密度估计值。 4. 可视化部分 ```python import numpy as np import matplotlib.pyplot as plt from mpl_toolkits.mplot3d import Axes3D # 生成三维数据 data = np.random.randn(1000, 3) # 计算密度估计值 density = density_estimation(data, h=0.5) # 可视化 fig = plt.figure() ax = fig.add_subplot(111, projection='3d') ax.scatter(data[:, 0], data[:, 1], data[:, 2], c=density, cmap='viridis') plt.show() ``` 其中,`data`是一个`N x 3`的numpy数组,表示`N`个样本点在三维空间中的坐标,`density`是一个长度为`N`的numpy数组,表示每个样本点的密度估计值,`c`参数用于指定每个点的颜色,`cmap`参数用于指定颜色映射。运行程序后将得到一个三维散点图,其中每个散点的颜色表示对应样本点的密度估计值。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 5
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值