核光滑方法(二)

最新推荐文章于 2020-12-04 11:02:32 发布

杲昃

最新推荐文章于 2020-12-04 11:02:32 发布

阅读量2.6k

点赞数

分类专栏： ESL

本文链接：https://blog.csdn.net/xc_xc_xc/article/details/53300926

版权

ESL 专栏收录该内容

8 篇文章 0 订阅

订阅专栏

昨天听了实验室师兄的报告，会后询问他看 $ESL$ 的事宜。师兄说你不实现书中的算法就是偷懒，想想确实是这样。

P维空间局部回归

多维空间的表达式
如下:

$m i n β (x 0) \sum i = 1 N K λ (x 0, x i) (y i - b (x i) T β (x 0)) 2 K λ (x 0, x) = D (| | x - x 0 | | λ)$ $min_{\beta(x_0)}\sum^N_{i=1}K_\lambda(x_0,x_i)(y_i-b(x_i)^T\beta(x_0))^2\\K_\lambda(x_0,x)=D(\frac{||x-x_0||}{\lambda})$
$||\cdot||$ 是欧几里得范数，也就是 $||X||=\sqrt{|x_1|^2+...+|x_p|^2}$ ，书中说分数会趋向于 $1$ ，我的理解是在高维空间中，各个
点分布稀疏，距离较远，导致 $\frac{||x-x_0||}{\lambda}$ 趋向于1。这时使用核函数不能有效区分点，起不了多大作用。

在高维空间中，局部回归方法作用不佳。因为当维度升高时，我们没有办法同时满足局部性和客观数量的样本数。局部性是用距离来度量的，保证局部性才能保证低偏差。而数量可观的样本数才能保证低方差。

注: $\ predictor$ 是指样本变量个数？

p维空间里结构化的局部回归

当维数较大，样本较少时，局部回归作用不佳。如果我们能够对模型的结构做一些假设，或许能够改善这个问题。

结构化的核函数

$K λ, A (x 0, x) = D (( x - x 0 ) T A ( x - x 0 ) λ)$ $K_{\lambda,A}(x_0,x)=D(\frac{(x-x_0)^TA(x-x_0)}{\lambda})$
我们可以对 $A$ 施加一些限制，来达到我们的目的。譬如可以增大某一变量的权重。这样讲，我们不仅可以对距离不同的点施加权重，还可以依据需要对不同的属性添加权重。

结构化回归函数

注：方差分析(ANOVA)
方差分析是从观测变量的方差入手，研究诸多变量中哪些控制变量是对观测变量有显著影响的变量。
方差分析的基本思想是：通过分析研究不同来源的变异对总变异的贡献大小，从而确定可控因素对研究结果影响力的大小。
这个坑有点大，要专门学习；

局部相似度

$l (β (x 0)) = \sum i = 1 N K λ (x 0, x i) l (y i, x T i β (x 0))$ $l(\beta(x_0))=\sum^N_{i=1}K_\lambda(x_0,x_i)l(y_i,x_i^T\beta(x_0))$
multiclass liner logistic regression
$P r (G = j | X = x) = e β j 0 + β T j x 1 + \sum J - 1 k = 1 e β k 0 + β T k x$ $Pr(G=j|X=x)=\frac{e^{\beta_{j0}+\beta^T_jx}}{1+\sum^{J-1}_{k=1}e^{\beta_{k0}+\beta^T_kx}}$
local log-likelihood
这公式还没有想明白 $(x_i-x_0)$
$\sum i = 1 N K λ (x 0, x i) {β g i 0 (x 0) + β g i (x 0) T (x i - x 0) - l o g [1 + \sum k = 1 J - 1 e β k 0 (x 0) + β (x 0) T k (x i - x 0)]}$ $\sum^N_{i=1}K_\lambda(x_0,x_i)\{\beta_{g_i0}(x_0)+\beta_{g_i}(x_0)^T(x_i-x_0)-log[1+\sum^{J-1}_{k=1}e^{\beta_{k0}(x_0)+\beta(x_0)^T_k(x_i-x_0)}]\}$
the fitted posterior probilities
$P r^(G = j | X = x 0) = e β ^ j 0 ( x 0 ) 1 + \sum J - 1 k = 1 e β ^ k 0 ( x 0 )$ $\hat{Pr}(G=j|X=x_0)=\frac{e^{\hat \beta_{j0}(x_0)}}{1+\sum^{J-1}_{k=1}e^{\hat\beta_{k_0}(x_0)}}$