DBSCAN聚类算法含义:
https://blog.csdn.net/lys_828/article/details/108702381
DBSCAN聚类参数主要有这两个:eps 和 min_simples
DBSCAN调参可视化部分:
# 测试调参部分
mask_test1 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)
mask_test2 = np.zeros(shape=(round((1.0 - 0.05) / 0.05), round((1500 - 50) / 50)), dtype=np.float32)
# 存放各个参数的组合计算出来的模型评估得分和噪声比 # 注意浮点数int计算时末尾为x.99999
for i in tqdm.tqdm(np.arange(0.05, 1.0, 0.05), total=len(np.arange(0.05, 1.0, 0.05))):
for j in np.arange(50, 1500, 50):
try: # 因为不同的参数组合,有可能导致计算得分出错,所以用try
features = StandardScaler().fit_transform(get_lane_embedding_feats_result['lane_embedding_feats'])
db = DBSCAN(eps=i, min_samples=j).fit(features)
labels = db.labels_ # 得到DBSCAN预测的分类便签
k = metrics.silhouette_score(features, labels) # 轮廓系数评价聚类的好坏,值越大越好
raito = len(labels[labels[:] == -1]) / len(labels) # 计算噪声点个数占总数的比例
n_clusters_ = len(set(labels)) - (1 if -1 in labels else 0) # 获取分簇的数目
mask_test1[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = k
mask_test2[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = raito
except:
mask_test1[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = 0.0
mask_test2[int(round((i - 0.05) / 0.05))][int(round((j - 50) / 50))] = 1.0
plt.figure('mask_test1')
plt.imshow(mask_test1 * 255, cmap='gray')
plt.figure('mask_test2')
plt.imshow(mask_test2 * 255, cmap='gray')
plt.show()
plt.pause(5)
在使用训练得到的模型进行测试的过程中,聚类时遇到DBSCAN最优聚类参数不稳定的情况:
左图:轮廓系数评价聚类的好坏,值越大越好 右图:计算噪声点个数占总数的比例,值越小越好
分析原因:
- 测试图未进行统一:将三个测试图统一到统一亮度、色度。代码:https://blog.csdn.net/qq_36638362/article/details/109311353 结果:未使得优化
- 训练集含有多种不同类型的对象,对应的标签:重新进行标签训练。结果:未使得优化
- 。。。。。分析中