统计学习中的Kernel Function——【Kernel density estimation】【Kernel Regression】

最新推荐文章于 2023-09-18 16:49:37 发布

Statistic_Code

最新推荐文章于 2023-09-18 16:49:37 发布

阅读量262

点赞数

本文链接：https://blog.csdn.net/qq_40268680/article/details/116204149

版权

本文探讨统计学习中的Kernel Function，重点介绍了Kernel density estimation（无监督学习）和Kernel Regression（有监督学习）。在Kernel density estimation中，解释了Kernel的思想和参数h的选择，而在Kernel Regression部分，讲解了Local-Constant和Local-Linear Estimator的概念。

摘要由CSDN通过智能技术生成

统计学习中的Kernel Function

0.引入

假设随机变量 $X$ 来自某个未知分布 $F (X)$ , 我们有一组 $X$ 的抽样观测: $x_1,...x_n$ .
我们的问题是: 该如何估计它背后密度函数 $f (x)$ ?

1. Kernel density estimation(无监督学习)

1.1思想

我们已经假设分布函数为 $F (x)$ ，密度函数为 $f (x)$ .
估计 $F (x)$ 的朴素想法就是用样本的经验分布 $F_n(x)$ 去估计 $F (x)$ ,这是因为根据格里文科定理,我们知道当样本容量 $n \to \infty$ 时， $F_n(x)$ 以概率1 一致收敛于 $F (x)$ .

根据定义, $F_n(x)=\frac{1}{n}\sum_{i=1}^nI(x_i\le x)$

下面考虑我们的估计目标 $f (x)$ , 我们知道密度函数是分布函数的导数, 自然地我们有: $f(x)=lim_{h\to 0 \frac{F(x+h)-F(x-h)}{2h} }$

将 $F (x)$ 的估计 $F_n(x)$ 带入: $\frac{F_n(x+h)-F_n(x-h)}{2h} =\frac{\frac{1}{n}\sum_{i=1}^nI(x-h\le xi\le x+h)}{2h}=\frac{1}{n}\sum_{i=1}^n\frac{1}{2}\frac{1}{h}I(x-h\le x_i \le x+h)=\frac{1}{n}\sum_{i=1}^n\frac{1}{2}\frac{1}{h}I(-1\le \frac{x_i-x}{h} \le 1)=\frac{1}{n}\sum_{i=1}^n\frac{1}{2}\frac{1}{h}I(|\frac{x_i-x}{h}| \le 1)$

最低0.47元/天解锁文章

Statistic_Code

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
统计学习中的Kernel Function——【Kernel density estimation】【Kernel Regression】

统计学习中的Kernel Function0.引入假设随机变量XXX来自某个未知分布F(X)F(X)F(X) , 我们有一组XXX的抽样观测: x1,...xnx_1,...x_nx1,...xn .我们的问题是: 该如何估计它背后密度函数f(x)f(x)f(x) ?1. Kernel density estimation(无监督学习)1.1思想我们已经假设分布函数为F(x)F(x)F(x) ，密度函数为f(x)f(x)f(x).估计F(x)F(x)F(x)的朴素想法就是用样本的经验分布
复制链接

扫一扫

专栏目录