向量的相似性度量时常常采用计算距离的方式进行,以下是对各种距离计算公式的汇总及pyhton实现。
在介绍距离公式之前首先引入范数的概念。
范数(百度百科):向量的范数可以简单、形象的理解为向量的长度,或者向量到坐标系原点的距离,或者相应空间内的两点之间的距离。
向量的范数定义:向量的范数是一个函数 ∥x∥ 满足非负性 ∥x∥≥0 ,齐次性 ∥cx∥=|c|∥x∥ ,三脚不等式 ∥x+y∥≤∥x∥∥y∥ 。
L1范数: ∥x∥ 为x向量各元素绝对值之和。
L2范数: ∥x∥ 为x向量各元素平方和的开方。L2范数又称Euclifean范数或者Frobenius范数。
Lp范数: ∥x∥ 为x向量各元素绝对值p次方之和的1/p次方。
L ∞ 范数: ∥x∥ 为x向量各元素绝对值最大的那个元素,如下所示。
limk→∞(∑i=1n∣∣pi−qi|