如何衡量两个分布的相似性（更新中）

lankuohsing

已于 2022-01-23 21:42:35 修改

阅读量3.9k

点赞数 1

分类专栏：数学基础机器学习深度学习文章标签：人工智能机器学习概率论统计学

于 2022-01-13 22:43:28 首次发布

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/THUChina/article/details/122484443

版权

深度学习同时被 3 个专栏收录

12 篇文章 0 订阅

订阅专栏

11 篇文章 0 订阅

订阅专栏

6 篇文章 0 订阅

订阅专栏

文章目录

0. 简介
1. 数学定义

https://blog.csdn.net/fengdu78/article/details/114325589
https://www.cnblogs.com/arkenstone/p/5496761.html
https://en.wikipedia.org/wiki/Kolmogorov%E2%80%93Smirnov_test#:~:text=In%20statistics%2C%20the%20Kolmogorov%E2%80%93Smirnov,test)%2C%20or%20to%20compare%20two

0. 简介

KS检验(Kolmogorov–Smirnov test)是由苏联数学家Andrey Kolmogorov和Nikolai Smirnov提出的一种无参数检验方法。它可以用来解决两类问题：

一个集合中的样本，属于某个具体的分布的概率是多少；
两个集合的样本，属于同一个分布的概率是多少。

具体来讲，KS检验会计算一个集合的样本的经验分布函数与给定分布函数（或者另一个集合的样本的经验分布函数）的距离。
注意，KS检验只能处理1维特征。

1. 数学定义

对于一个具有n个独立同分布的样本集合 $X=\{X_1,X_2,\cdots,X_n\}$ ，它的经验分布函数(empirical distribution function)为：
$F_n(x)=\frac{num of(samples\leq x)}{n}=\frac{1}{n}\sum_{i=1}^{n}1_{[-\infty,x]}(X_i)\tag{1-1}$
其中 $1_{[-\infty,y]}(x)$ 是指示性函数，当 $x\leq y$ 时值为1，否则值为0.
对于一个给定的分布函数 $F (x)$ ,KS检验就是要计算如下检验量：
$D_n=\sup \limits_{x}|F_n(x)-F(x)|$

关注

1
点赞
踩
2

收藏

觉得还不错? 一键收藏
0
评论
如何衡量两个分布的相似性（更新中）

https://blog.csdn.net/fengdu78/article/details/114325589https://www.cnblogs.com/arkenstone/p/5496761.html
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。