题目描述
散列函数 h h h, n n n 个不同的关键字 k e y key key,散列到 T T T 中,长度为 m m m。假设满足简单一致散列法。求期望的碰撞数,即 集合 { { k , l } : k ≠ l a n d h ( k ) = h ( l ) } \{\{k,l\}: k\neq l \: and \: h(k) = h(l)\} {{k,l}:k=landh(k)=h(l)}的期望的基?
解答
设
x
i
x_i
xi 表示插入到
T
T
T 中的第
i
i
i 个元素,
i
=
1
,
2
,
⋯
,
n
i=1,2,\cdots,n
i=1,2,⋯,n。
k
i
=
k
e
y
[
x
i
]
k_i = key[x_i]
ki=key[xi]。对于关键字
k
i
k_i
ki,
k
j
k_j
kj,定义指示器随机变量
X
i
j
=
I
{
h
(
k
i
)
=
h
(
k
j
)
}
X_{ij} = I\{h(k_i) = h(k_j)\}
Xij=I{h(ki)=h(kj)}。
基于简单一致散列假设,概率 P r { h ( k i ) = h ( k j ) } = 1 m Pr\{h(k_i) = h(k_j)\} = \frac{1}{m} Pr{h(ki)=h(kj)}=m1。则 E ( X i j ) = 1 m E( X_{ij}) = \frac{1}{m} E(Xij)=m1。
第 i i i 个元素发生碰撞的期望即为,在 i i i 之后插入的 j j j 可能发生的碰撞,即 E ( ∑ j > i n X i j ) E(\displaystyle \sum_{j>i}^n X_{ij}) E(j>i∑nXij)。
那么对于所有的元素发生碰撞数的期望为:
E
[
∑
i
=
1
n
(
∑
j
>
i
n
X
i
j
)
]
E[\displaystyle \sum_{i=1}^n(\displaystyle \sum_{j>i}^n X_{ij})]
E[i=1∑n(j>i∑nXij)]
= ∑ i = 1 n ( ∑ j > i E X i j ) =\displaystyle \sum_{i=1}^n(\displaystyle \sum_{j>i}EX_{ij}) =i=1∑n(j>i∑EXij)
= ∑ i = 1 n ( ∑ j > i 1 m ) =\displaystyle \sum_{i=1}^n(\displaystyle \sum_{j>i} \frac{1}{m}) =i=1∑n(j>i∑m1)
= 1 m ∑ i = 1 n ( ∑ j > i n ⋅ 1 ) =\frac{1}{m} \displaystyle \sum_{i=1}^n(\displaystyle \sum_{j>i}^n \cdot 1) =m1i=1∑n(j>i∑n⋅1)
= 1 m ∑ i = 1 n ( n − i ) =\frac{1}{m} \displaystyle \sum_{i=1}^n(n-i) =m1i=1∑n(n−i)
= 1 m ( ∑ i = 1 n ( n ) − ∑ i = 1 n ( i ) ) =\frac{1}{m} \bigg( \displaystyle \sum_{i=1}^n(n) - \displaystyle \sum_{i=1}^n(i) \bigg) =m1(i=1∑n(n)−i=1∑n(i))
= 1 m ( n 2 − n ( n + 1 ) 2 ) =\frac{1}{m} \bigg( n^2 - \frac{n(n+1)}{2} \bigg) =m1(n2−2n(n+1))
= n 2 − n 2 m =\frac{n^2 - n}{2m} =2mn2−n。