K-Means推导

个人笔记,非教程

对于每个样本 x i x_i xi,将其标记为距离类别中心最近的类别,即

l a b e l i = arg ⁡ min ⁡ ∣ ∣ x i − μ j ∣ ∣ label_i=\arg \min ||x_i-\mu_j|| labeli=argminxiμj

目标

min ⁡ S S E = ∑ i = 1 K ∑ x j ∈ C i ( x j − μ i ) 2 = ∑ i = 1 K ∑ x j ∈ C i ( x j T x j − x j T μ i − μ i T x j + μ i T μ i ) = ∑ i = 1 K ( ∑ x j ∈ C i x j T x j − ∑ x j ∈ C i x j T μ i − ∑ x j ∈ C i μ i T x j + ∑ x j ∈ C i μ i T μ i ) = ∑ i = 1 K ( ∑ x j ∈ C i x j T x j − ( ∑ x j ∈ C i x j T ) μ i − μ i T ( ∑ x j ∈ C i x j ) + ∣ C i ∣ μ i T μ i ) \begin{aligned} \min SSE&= \sum_{i=1}^{K}\sum_{x_j\in C_i} (x_j-\mu_i)^2 \\ &=\sum_{i=1}^{K}\sum_{x_j\in C_i} (x_j^Tx_j-x_j^T\mu_i-\mu_i^Tx_j+\mu_i^T\mu_i) \\ &=\sum_{i=1}^{K}(\sum_{x_j\in C_i} x_j^Tx_j-\sum_{x_j\in C_i}x_j^T\mu_i-\sum_{x_j\in C_i}\mu_i^Tx_j+\sum_{x_j\in C_i}\mu_i^T\mu_i) \\ &=\sum_{i=1}^{K}(\sum_{x_j\in C_i} x_j^Tx_j-(\sum_{x_j\in C_i}x_j^T)\mu_i-\mu_i^T(\sum_{x_j\in C_i}x_j)+|C_i|\mu_i^T\mu_i) \\ \end{aligned} minSSE=i=1KxjCi(xjμi)2=i=1KxjCi(xjTxjxjTμiμiTxj+μiTμi)=i=1K(xjCixjTxjxjCixjTμixjCiμiTxj+xjCiμiTμi)=i=1K(xjCixjTxj(xjCixjT)μiμiT(xjCixj)+CiμiTμi)
(SSE,误差平方和(Sum of the Squared Error,SSE))

求导

∂ S S E ∂ μ i = − ( ∑ x j ∈ C i x j ) − ( ∑ x j ∈ C i x j ) + 2 ∣ C i ∣ μ i \frac{\partial SSE}{\partial \mu_i} =-(\sum_{x_j\in C_i}x_j)-(\sum_{x_j\in C_i}x_j)+2|C_i|\mu_i μiSSE=(xjCixj)(xjCixj)+2Ciμi

∂ S S E ∂ μ i = 0 \frac{\partial SSE}{\partial \mu_i} =0 μiSSE=0

μ i = 1 ∣ C i ∣ ∑ x j ∈ C i x j \mu_i=\frac{1}{|C_i|} \sum_{x_j\in C_i}x_j μi=Ci1xjCixj

求解,反复迭代即可

l a b e l i = arg ⁡ min ⁡ ∣ ∣ x i − μ j ∣ ∣ label_i=\arg \min ||x_i-\mu_j|| labeli=argminxiμj
μ i = 1 ∣ C i ∣ ∑ x j ∈ C i x j \mu_i=\frac{1}{|C_i|} \sum_{x_j\in C_i}x_j μi=Ci1xjCixj

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值