自定义博客皮肤VIP专享

*博客头图：

点击选择上传的图片

格式为PNG、JPG，宽度*高度大于1920*100像素，不超过2MB，主视觉建议放在右侧，请参照线上博客头图

请上传大于1920*100像素的图片！

博客底图：

点击选择上传的图片

图片格式为PNG、JPG，不超过1MB，可上下左右平铺至整个背景

栏目图：

点击选择上传的图片

图片格式为PNG、JPG，图片宽度*高度为300*38像素，不超过0.5MB

主标题颜色：

RGB颜色，例如：#AFAFAF

Hover：

RGB颜色，例如：#AFAFAF

副标题颜色：

RGB颜色，例如：#AFAFAF

预览取消提交

自定义博客皮肤

-+

上一步保存

qq_39889473的博客

数据科学

关注

文章平均质量分 81

关注数：文章数：1 文章阅读量：620 文章收藏量：1

作者: AIDD Learning

聚焦全球人工智能与药物研发领域进展，探索生物医药行业创新。

展开

数据科学中使用的17 种相似性和相异性度量之欧氏距离

在数据科学中，相似性度量是一种衡量数据样本如何相互关联或相互接近的方法。另一方面，相异性度量是告诉数据对象有多少是不同的。此外，当相似的数据样本被分组到一个集群中时，这些术语通常用于聚类。所有其他数据样本被分组到不同的样本中。它还用于分类（例如 KNN），其中根据特征的相似性标记数据对象。另一个例子是当我们谈论与其他数据样本相比不同的异常值时（例如，异常检测）。相似性度量通常表示为一个数值：当数据样本越相似时它就越高。它通常通过转换表示为零和一之间的数字：零表示相似度低（数据对象不相似）。

原创 2023-05-14 21:38:24 · 620 阅读 · 0 评论