Bhattacharyya距离

转载 2013年12月05日 12:08:45

Bhattacharyya距离

在统计学中,Bhattacharyya距离(以下称巴氏距离)测量的是两个离散或连续概率分布的相似性。计算方式和Bhattacharyya系数关系很密切。两种计算方式都以A. Bhattacharyya名字命名,Bhattacharyya是一位30年代在印度统计研究所工作的统计学家。巴氏系数可用来对两组样本的相关性进行测量。这一方法常用来作分类器算法。[1]

 

数学定义

-离散概率分布

  对于在X数域上的两个离散概率分布p和q,巴氏距离定义为[2]:

 
  DB(p,q) = -ln(BC(p,q))
 
  其中
 
  BC(p,q) = ∑√p(x)q(x)
 
  BC被称作Bhattacharyya系数(巴氏系数)
 

  0≤BC≤1q且0≤DB≤∞

-连续概率分布

  在连续情形中,Bhattacharyya系数如下定义:

 
  BC(p,q) = ∫√p(x)q(x)dx
 
  0≤BC≤1q且0≤DB≤∞
 
  两种情形中,巴氏距离DB均不满足三角不等式
 

Bhattacharyya系数

  Bhattacharyya系数[3](Bhattacharyya Coefficient, 巴氏系数)是对两个统计样本的重叠量的近似计算。巴氏系数可用来对两组样本的相关性进行测量。

 
  计算巴氏系数涉及到对该两个样本的重叠部分进行基本形式的积分。两个样本值的积分被分成指定数目的部分。而每一个样本的每一个部分的成员数被用于下式中:
 
  Bhattacharyya = ∑{i=1|n}√(∑ai·∑bi)
 
  其中,a,b为两个样本,n是分块数,ai, bi分别是在a, b中第i部分的成员数。
 
  这样一来,这个式子就会随着因某块中有两个样本的公共成员而变大,也会随着某块中有一大片重叠的样本成员而变大。分块数的选定依赖于样本中的成员数量;如果分块太少会因过估了重叠区域而失去精确性,如果分块太多会因为造成空块而失去精确性。
 
  如果两个样本完全没有重叠,巴氏系数将会等于0,因为每一个分块都将被0乘。这意味着完全分离的样本不能被巴氏系数单独测定出来。

In statistics, the Bhattacharyya distance measures the similarity of two discrete probability distributions. It is normally used to measure the separability of classes in classification.

For discrete probability distributions p and q over the same domain X, it is defined as:

巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南

 

where:

巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南

 

is the Bhattacharyya coefficient. For continuous distributions, the Bhattacharyya coefficient is defined as:

巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南

 

In either case, 巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南 and 巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南 . DB need not obey the triangle inequality, but 巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南 does obey the triangle inequality.

For multivariate Gaussian distributions pi = N(mi,Pi),

巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南,

 

where mi and Pi are the means and covariances of the distributions, and

巴氏距离(Bhattacharyya distance, Bhattacharyya 系数) - fhqdddddd - 流浪云南

 
 
 
参考资料1 2

Bhattacharyya, A. (1943). "On a measure of divergence between two statistical populations defined by their probability distributions". Bulletin of the Calcutta Mathematical Society 35: 99–109. MR00103  

http://www.jstor.org/stable/25047882

3 扩展阅读:1

Kailath, T. (1967). "The Divergence and Bhattacharyya Distance Measures in Signal Selection". IEEE Transactions on Communication Technology 15 (1): 52–60. doi:10.1109/TCOM.1967.1089532.

2

H氏距离 http://en.wikipedia.org/wiki/Hellinger_distance

3

D. Comaniciu, V. Ramesh, P. Meer: Real-Time Tracking of Non-Rigid Objects using Mean Shift, BEST PAPER AWARD, IEEE Conf. Computer Vision and Pattern Recognition (CVPR'00), Hilton Head Island, South Carolina, Vol. 2, 142-149, 2000

4

一些属性列表,请查看: http://www.mtm.ufsc

 

转自http://hi.baidu.com/useiee/blog/item/4b28ab0faf6c40306159f371.html

机器学习中的相似性度量

机器学习中的相似性度量 发表于 2012-01-03   在做分类时常常需要估算不同样本之间的相似性度量(Similarity Measurement),这时通常采用的方法就是计算样本...
  • pi9nc
  • pi9nc
  • 2013年06月09日 22:03
  • 20480

数学中的常见的距离公式

最近看到文章中对距离的衡量依据所针对的问题,针对所使用到的各种距离公式从网上搜罗如下 1. 欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 ...
  • Losteng
  • Losteng
  • 2016年03月15日 09:28
  • 17246

巴氏距离 Bhattacharyya

http://en.wikipedia.org/wiki/Bhattacharyya_coefficient http://blog.chinaunix.net/u2/61062/showart...
  • qtlyx
  • qtlyx
  • 2015年11月03日 21:29
  • 1155

距离度量的表示法

1. 欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为: ...
  • hermito
  • hermito
  • 2014年11月10日 22:27
  • 3572

Bhattacharyya 距离(附matlab代码)

function d=bhattacharyya(X1,X2)  % BHATTACHARYYA  Bhattacharyya distance between two Gaussian cla...
  • u011707992
  • u011707992
  • 2014年05月06日 18:57
  • 3174

nowcoder contest 储物点的距离

题目描述一个数轴,每一个储物点会有一些东西,同时它们之间存在距离。 每次给个区间[l,r],查询把这个区间内所有储物点的东西运到另外一个储物点的代价是多少? 比如储物点i有x个东西,要运到储物点j...
  • w_x_s_h_h
  • w_x_s_h_h
  • 2017年12月19日 21:16
  • 87

Bhattacharyya 距离(附matlab代码)

function d=bhattacharyya(X1,X2)  % BHATTACHARYYA  Bhattacharyya distance between two Gaussian cla...
  • u011707992
  • u011707992
  • 2014年05月06日 18:57
  • 3174

距离度量的表示法

1. 欧氏距离,最常见的两点之间或多点之间的距离表示法,又称之为欧几里得度量,它定义于欧几里得空间中,如点 x = (x1,...,xn) 和 y = (y1,...,yn) 之间的距离为: ...
  • hermito
  • hermito
  • 2014年11月10日 22:27
  • 3572

nowcoder contest 储物点的距离

题目描述一个数轴,每一个储物点会有一些东西,同时它们之间存在距离。 每次给个区间[l,r],查询把这个区间内所有储物点的东西运到另外一个储物点的代价是多少? 比如储物点i有x个东西,要运到储物点j...
  • w_x_s_h_h
  • w_x_s_h_h
  • 2017年12月19日 21:16
  • 87

一些距离表示和相似度量

信号或者多维空间里,常常需要用一些距离或者相关度量来衡量两个点或向量的距离和相似度。下面列举一些常用于不同的模型和空间的距离。 1. 欧氏距离(euclidean distance)      ...
  • u010076558
  • u010076558
  • 2014年11月27日 21:54
  • 4024
内容举报
返回顶部
收藏助手
不良信息举报
您举报文章:Bhattacharyya距离
举报原因:
原因补充:

(最多只允许输入30个字)