动态每日更新算法题,想要一起学习的可以关注一下
一、密度等高线是什么?
直接看效果图来举例子。
其实很简单,假设我们在这个空间中(二维)给他划分成m*n的网格。其实我们求的就是这三个高斯分布对其边上网格的密度。换句话来说,对于网格中的某个点,我们假设这个点为观测点,那我们我们只需要求他其他点(样本点)对该点的影响程度总和,算出来的总和就是当前网格点的密度。
二、到底怎么画等高线
1.网格
其实密度等高线代表的就是当前空间中在这个点的密度大小,比如说上图[0.2,0.2]这个点的密度等高线就是其他对该点的影响程度总和(密度),当然在计算的时候我们可以取[0.2,0.2]周边的点,也可以取所有点的叠加,无非就是时间复杂度的区别
2.代码
这边算法用的是Denclue算法,求的是概率密度
see_1=np.linspace(0,100,20) #其实就是linspace来拿到两组点组合成网格
see_2=np.linspace(0,100,40) #生成观测点
X_all,Y_all = np.meshgrid(see_1, see_2) #组合观测点,观测点的X,Y
all_see=np.c_[X_all.ravel(),Y_all.ravel()] #观测点
de=[]
H=1.5
for i in all_see:
s = 0
for j in range(len(data)):
s += k_gauss((i - data[j]) / H)
de.append(s / (len(data) * (H ** 2)))
###等高线图 Z1是观测点的密度值
z1 = np.reshape(np.array(de), (40, 20))
for i in label:
plt.scatter(dc.ps[i][0],dc.ps[i][1],c='gray',alpha=0.3)
plt.contour(X_all, Y_all, z1,colors='black')
计算密度的公式如下
def k_gauss(x):
return math.exp(-0.5 * sqrs(x)) / (2 * math.pi)