根据
documentation:
If C is specified, it specifies values at the coordinate (x[i],y[i]). These values are accumulated for each hexagonal bin and then reduced according to reduce_C_function, which defaults to numpy’s mean function (np.mean). (If C is specified, it must also be a 1-D sequence of the same length as x and y.)
这意味着对于每个bin,存储相应的C值,然后将reduce_C_function应用于它们.由于默认函数是np.mean,因此结果不是您想要获得的结果而是平均值而不是总和.要实际获得所有权重的总和,应将其更改为np.sum,以便对bin中每个(x,y)的C值求和,而不是对它们求平均值.
此示例显示了与简单数据的区别:
N = 10**5
x = np.random.normal(size=N)
y = np.random.normal(size=N)
plt.figure(figsize=(12,4)); plt.subplot(131)
plt.hexbin(x,y); plt.colorbar()
plt.subplot(132)
plt.hexbin(x,y,C=np.ones(N)); plt.colorbar()
plt.subplot(133)
plt.hexbin(x,y,C=np.ones(N),reduce_C_function=np.sum)
plt.colorbar(); plt.tight_layout()
现在,对于所有值(从高斯分布生成),权重设置为1,因此加权直方图的正确算法应返回与未加权直方图相同的算法.输出如下:
左侧面板是未加权的图,显示2D高斯,中间面板是C的默认行为,平均每个bin的所有C值,因此,所有箱中的计数为1,右侧面板是np.sum,检索2D高斯.