K-means
基于欧式距离的算法,认为两个目标距离越近,相似度越大。
步骤:
选择k个样本作为初始聚类中心
对于每一个样本点,计算到每个聚类中心的距离,并将其分配到距离最小的类别中
针对每个类别重新计算它的聚类中心
重复上述两个步骤,直到达到终止条件
线性回归
找到一条直线,使得这些点尽量在直线或直线的周围
y
=
w
x
+
b
y=wx+b
y=wx+b
损失函数:
1
2
∑
(
y
−
(
w
x
+
b
)
)
2
\frac{1}{2}\sum(y-(wx+b))^2
21∑(y−(wx+b))2
SVM
寻找一个最优超平面,使得两个类别的支持向量到超平面的距离最远
SVM要最优化支持向量的超平面的距离margin