趁我未失忆之前,记录过去曾经的自己
前言
914博主总是希望大家可以多了解底层数学逻辑,会帮助你们在建模或设定参数会有极大的帮助,也是高效影响你们建模的水平与降低踩坑的机会,所以这一篇文章会讲解基础的数学理论。
一、数学符号介绍
那以下这个范例,用程序对造就是如下
q=0
for i in range(1,n):
q+=i
return(q)
二、向量的认识
在数学中,向量(也称为欧几里得向量、几何向量、矢量),指具有大小(magnitude)和方向的量。它可以形象化地表示为带箭头的线段。箭头所指:代表向量的方向;线段长度:代表向量的大小。如同下图显示。
向量的记法:印刷体记作粗体的字母(如a、b、u、v),书写时在字母顶上加一小箭头“→”。
如果给定向量的起点(A)和终点(B),可将向量记作AB(并于顶上加→)。
三、许多聚类演算法采用以下两种资料架构
- 资料矩阵(data matrix):用p个变数来表示n个对象,也叫双模式矩阵(two-mode Matrix),行与列代表不同实体.(下图)
- 相异矩阵(Dissimilarity matrix):存放n个对象两两之间的近似值(或距离),也叫单模式矩阵(two-mode Matrix ),行与列代表相同实体.(下图)
四、距离计算-欧机理得距离
我这里介绍欧机理得距离,但你们也可以用别的求距离的公式,例如春节大片唐人街探案2裡面用到的曼哈頓(Manhattan)距離法或是明可夫斯基(Minkowski)距離法之類都可以使用。
不過通常一般的kmean教程都是使用欧机理得距离,我們今天就用欧机理得距离為大家講解.
兩點距離怎麼求呢?
点i =(x1,…,xn)和 j =(y1,…,yn)是两个n维资料的对象 .求两点距离欧几里得距离,公式如下:
如果以上还不是很理解,则我们可以先用直线的距离计算来了解。兩個點的直線距離怎麼求,同理可證多維的兩點直線距離怎麼求,也就知道欧几里得公式怎麽出来的。
延长AA’和BB’使之交与C点,显然角C等于90度,这样我们就构造出了一个三角形ABC,而我们要求的AB就在这个直角三角形上。因此我们是不是可以考虑看看用勾股定理来求出AB 。由勾股定理可以得知:
由A(-20,20)和B(20,-10),所以可知C(-20,-10)。因此可知:
所以把|AB|2次方移过去,就可求的
A点到C点 这条线是30,C点到B点这条线是40…取平方就是要将负数变正数