python聚类分析自定义距离_python - 在sklearn中使用自定义距离度量进行聚类 - 堆栈内存溢出...

最新推荐文章于 2021-10-19 17:25:19 发布

weixin_39950552

最新推荐文章于 2021-10-19 17:25:19 发布

阅读量921

点赞数

文章标签： python聚类分析自定义距离

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/weixin_39950552/article/details/111910043

版权

我转载了您的代码，但确实收到了您的错误。我在这里解释得更好：

他具有一个vectorized_text变量( np.stack )，该变量模拟一个“热编码”功能集(仅包含0和1)。在DBSCAN模型中，他使用custom_metric函数来计算距离。可以预期的是，在运行模型时，自定义指标函数将观测对按原样作为参数对：一个热编码值，但是当在距离函数中打印这些值时，仅照原样取，正如他在问题中所描述的，另一个似乎是一列实际价值：

x = [0.5 0.5 0.5 ... 0.5 0.5] y = [0. 0. 0. 1. 0. 0. ... 1. 0.]

无论如何，当我将列表传递给fit参数时，该函数将按原样获取值：

from sklearn.cluster import KMeans, DBSCAN, MeanShift

x = [1, 0, 1]

y = [0, 0, 1]

feature_set = [x*5]*5

def distance(x, y):

# Printing here the values. Should be 0s and 1s

print(x, y)

match_count = 0.

for xi, yi in zip(x, y):

if float(xi) == 1. and xi == yi:

match_count += 1

return match_count

def custom_metric(x, y):

# x, y are two vectors

最低0.47元/天解锁文章

weixin_39950552

关注

0
点赞
踩
1

收藏

觉得还不错? 一键收藏
0
评论
python聚类分析自定义距离_python - 在sklearn中使用自定义距离度量进行聚类 - 堆栈内存溢出...

我转载了您的代码，但确实收到了您的错误。我在这里解释得更好：他具有一个vectorized_text变量( np.stack )，该变量模拟一个“热编码”功能集(仅包含0和1)。在DBSCAN模型中，他使用custom_metric函数来计算距离。可以预期的是，在运行模型时，自定义指标函数将观测对按原样作为参数对：一个热编码值，但是当在距离函数中打印这些值时，仅照原样取，正如他在问题中...
复制链接

扫一扫

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。