决策树-使得曼哈顿距离下的组内误差平方和最小的质心是这一组数的中位数

对于一个一维点集 A,设其中有 C 个点,记作 x x x,设使得曼哈顿距离下的组内误差平方和最小的质心的坐标为 x 0 x_{0} x0,则问题就是求解
argmin  ∑ ∣ x − x 0 ∣ \text{argmin }\sum\limits_{}^{}|x-x_{0}| argmin xx0
x ≥ x 0 x \geq x_{0} xx0 的点有 C 1 C_{1} C1 个, x < x 0 x<x_{0} x<x0 的点有 C 2 C_{2} C2 个,就有
argmin  ∑ x ≥ x 0 ( x − x 0 ) + ∑ x < x 0 ( x 0 − x ) = argmin  ∑ x ≥ x 0 x − ∑ x < x 0 x + ( C 2 − C 1 ) x 0 = f ( x 0 ) \begin{aligned} &\text{argmin }\sum\limits_{x \geq x_{0}}^{}\left(x-x_{0}\right) +\sum\limits_{x<x_{0}}^{}(x_{0}-x)\\ =&\text{argmin }\sum\limits_{x \geq x_{0}}^{}x-\sum\limits_{x<x_{0}}^{}x+(C_{2}-C_{1})x_{0}=f(x_{0}) \end{aligned} =argmin xx0(xx0)+x<x0(x0x)argmin xx0xx<x0x+(C2C1)x0=f(x0)
上式对 x 0 x_{0} x0 求偏导
∂ f ( x 0 ) ∂ x 0 = C 2 − C 1 = 0 C 2 = C 1 \begin{aligned} \frac{\partial f(x_{0})}{\partial x_{0}}=C_{2}-C_{1}&=0\\ C_{2}&=C_{1} \end{aligned} x0f(x0)=C2C1C2=0=C1
其中 C 1 C_{1} C1 x ≥ x 0 x \geq x_{0} xx0 的点的数量, C 2 C_{2} C2 x < x 0 x<x_{0} x<x0 的点的数量,若 C 1 = C 2 C_{1}=C_{2} C1=C2,即 x 0 x_{0} x0 为中位数

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值