r 语言计算欧氏距离_R语言实现46种距离算法

最新推荐文章于 2021-01-24 13:47:08 发布

Samuel Solomon

最新推荐文章于 2021-01-24 13:47:08 发布

阅读量8k

点赞数 1

文章标签： r 语言计算欧氏距离

本文链接：https://blog.csdn.net/weixin_30184337/article/details/111965820

版权

R的极客理想系列文章，涵盖了R的思想，使用，工具，创新等的一系列要点，以我个人的学习和体验去诠释R的强大。

R语言作为统计学一门语言，一直在小众领域闪耀着光芒。直到大数据的爆发，R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入，R语言的社区在迅速扩大成长。现在已不仅仅是统计领域，教育，银行，电商，互联网….都在使用R语言。

要成为有理想的极客，我们不能停留在语法上，要掌握牢固的数学，概率，统计知识，同时还要有创新精神，把R语言发挥到各个领域。让我们一起动起来吧，开始R的极客理想。

关于作者：

张丹(Conan), 程序员/Quant: Java,R,Nodejs

blog: http://blog.fens.me

email: bsspirit@gmail.com

前言

距离算法是做数据挖掘常用的一类算法，距离算法有很多种，比如欧式距离、马氏距离、皮尔逊距离，距离算法主要应用在计算数据集之间关系。本文用R语言来philentropy包，实现多种距离的算法，很多可能是大家完全没有听过的，让我们在开拓一下知识领域吧。

距离算法包philentropy

46种距离算法详解

距离函数的使用

1.距离算法包philentropy

在做距离算法调研时，无意中发了philentropy包。它实现了46个不同距离算法和相似性度量，通过不同数据的相似度比较，为基础研究提供了科学基础。philentropy包，为聚类、分类、统计推断、拟合优度、非参数统计、信息理论和机器学习提供了核心的计算框架，支持基于单变量或者多变量的概率函数的计算。

philentropy包主要包括了2种度量的计算方法，距离度量和信息度量。本文介绍距离度量的使用，对于信息度量的使用，请参考文章R语言实现信息度量。

本文的系统环境为：

Win10 64bit

R: 3.4.2 x86_64-w64-mingw32

安装philentropy包，非常简单，一条命令就可以了。

~ R

> install.packages("philentropy")

> library(philentropy)

查看距离算法列表

> getDistMethods()

[1] "euclidean" "manhattan" "minkowski" "chebyshev"

[5] "sorensen" "gower" "soergel" "kulczynski_d"

[9] "canberra" "lorentzian" "intersection" "non-intersection"

[13] "wavehedges" "czekanowski" "motyka" "kulczynski_s"

[17] "tanimoto" "ruzicka" "inner_product" "harmonic_mean"

[21] "cosine" "hassebrook" "jaccard" "dice"

[25] "fidelity" "bhattacharyya" "hellinger" "matusita"

[29] "squared_chord" "squared_euclidean" "pearson" "neyman"

[33] "squared_chi" "prob_symm" "divergence" "clark"

[37] "additive_symm" "kullback-leibler" "jeffreys" "k_divergence"

[41] "topsoe" "jensen-shannon" "jensen_difference" "taneja"

[45] "kumar-johnson" "avg"

46个距离算法，有一些是我们常用的比如：euclidean，manhattan，minkowski，pearson, cosine，squared_chi，其他的我也不知道，正好拓宽知识，好好学习一下。

philentropy包的函数，其实很简单，只有14个，大量的算法其实都已经被封装到distance()函数中，直接使用distance()函数就行完成各种算法的计算，让我们使用起来会非常方便。我们来看一下，函数列表：

distance(): 计算距离

getDistMethods()，

最低0.47元/天解锁文章

Samuel Solomon

关注

1
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
r 语言计算欧氏距离_R语言实现46种距离算法

R的极客理想系列文章，涵盖了R的思想，使用，工具，创新等的一系列要点，以我个人的学习和体验去诠释R的强大。R语言作为统计学一门语言，一直在小众领域闪耀着光芒。直到大数据的爆发，R语言变成了一门炙手可热的数据分析的利器。随着越来越多的工程背景的人的加入，R语言的社区在迅速扩大成长。现在已不仅仅是统计领域，教育，银行，电商，互联网….都在使用R语言。要成为有理想的极客，我们不能停留在语法上，要掌握牢固...
复制链接

扫一扫