算法 Hw3

最新推荐文章于 2024-09-12 11:03:37 发布

sereinXH

最新推荐文章于 2024-09-12 11:03:37 发布

阅读量658

点赞数 29

文章标签：算法

本文链接：https://blog.csdn.net/sereinXH/article/details/137202085

版权

Hw3 Counting Sort & Hash

1 Counting Sort
- 1
- 2
2 Hash table
3 Hash Function
4 Longest-probe bound for hashing
- 1
- 2
- 4
- 5

1 Counting Sort

1

// A[1..n]：0到k的n个数
// B[0..k]：记数数组
// 预处理
PRE-PROCESS(A, B, k)
  for i = 0 to k
    B[i] = 0
  for j = 1 to A.length
    B[A[j]] = B[A[j]] + 1
  // B[i]现在指值为i的元素个数
  for i = 1 to k
    B[i] = B[i] + B[i-1]
  // B[i]现在指值小于等于i的元素个数

// 得到在范围在(a,b)间数的个数
RANGE-CNT(B, a, b)
  return B[b] - B[a-1]

预处理时间代价： $\Theta(n+k)$
得到结果： $\Omicron(1)$

2

使用基数排序。
先在线性时间内确定输入序列中最大的元素，以确定所有元素的最高位。再按最低有效位进行排序。
每一位的排序耗时 $\Theta(n+k)$ ，总共可以在 $\Theta(10n+10k)$ 的时间将数组排好序。

2 Hash table

因为 $∣ U ∣ > nm$ ，且散列表大小为 $m$ ，所以一定存在一个大小为 $n$ 的子集，散列到到同一槽位。对于这个槽位的链表，使用链接法散列的查找，最坏情况需遍历该链表，此时的时间代价为 $\Theta(n)$ 。

3 Hash Function

记两个不同 $n$ 元组 $A=⟨a_0, a_1, . . . , a_{n−1}⟩$ 和 $B=⟨b_0, b_1, . . . , b_{n−1}⟩$ 。
于是存在至少一个下标 $k$ ，使 $a_k \neq b'_k$ ，将第一个符合要求的下标记作 $i$ 。
有散列函数：
$h_b(A) = h_b(⟨a_0, a_1, . . . , a_{n−1}⟩) = \Sigma_{j = 0}^{n-1}(a_j b^j) \mod p$
$h_b(B) = h_b(⟨b_0, b_1, . . . , b_{n−1}⟩) = \Sigma_{j = 0}^{n-1}(b_j b^j) \mod p$

将两者作差得：
$\begin {aligned}h_b(A) - h_b(B) &= \Sigma_{j = 0}^{n-1}((a_j - b_j) b^j) \mod p \\&= \Sigma_{j = 0}^{i-1}((a_j - b_j) b^j) + \Sigma_{j = i}^{n-1}((a_j - b_j) b^j) \mod p \\&= (a_i− b_i) b^i + \Sigma_{j = i+1}^{n-1}((a_j - b_j) b^j) \mod p \\&\geq (a_i− b_i) b^i \mod p \\& > -p\end{aligned}$

又有：
$|h_b(A) - h_b(B)| \leq p-1$

因为：
$\in \left\{0,1,...,p-1\right\}$
所以至多有 $p - 1$ 个不同值，使得 $h_b(A) \neq h_b(B)$

于是有：
$\frac{p - 1}{p} = 1 − \frac{1}{p} \leq \frac{n - 1}{p}$

所以证明了 $\Eta$ 是 $(n - 1) / p$ 全域的。

4 Longest-probe bound for hashing

1

$\begin {aligned} P(X > k) &= \frac{n}{m} \times \frac{n-1}{m-1} \times \frac{n-2}{m-2} \times ...\times \frac{n-(k-1)}{m-(k-1)} \\& \leq \frac{n}{m} \times \frac{n}{m} \times \frac{n}{m} \times ...\times \frac{n}{m} \\& \leq \frac{1}{2} \times \frac{1}{2} \times \frac{1}{2} \times ...\times \frac{1}{2} \\& = (\frac{1}{2})^{k} \\& = 2^{-k}\end{aligned}$

2

$k =2\lg n = \lg n^2$
所以：
$2\lg n) = \Omicron(2^{-\lg n^2}) = \Omicron(n^{-2}) = \Omicron(\frac{1}{n^2})$

4

$\begin {aligned} Pr(X > 2\lg n) &= Pr(X_1 > 2\lg n \cup X_2 > 2\lg n \cup ... \cup X_n > 2\lg n) \\& = Pr(X_1 > 2\lg n) + Pr(X_2 > 2\lg n) + ... + Pr(X_n > 2\lg n) \\& = n \times \Omicron(\frac{1}{n^2}) \\& = \Omicron(\frac{1}{n}) \end{aligned}$

5

$\begin {aligned} E[x] &= \Sigma_{k = 1}^{n}(k \times Pr(X_i = k)) \\& = \Sigma_{k = 1}^{2 \lg n}(k \times Pr(X_i = k)) + \Sigma_{k = 2 \lg n+1}^{n}(k \times Pr(X_i = k)) \\& \leq 2 \lg n \times Pr(X <k) + n \times Pr(X_i = 2 \lg n) \times (n-2 \lg n) \\& < 2 \lg n + n \times 2^{-2 \lg n} \times n \\& = 2 \lg n +1 \\& = \Omicron(\lg n) \end{aligned}$

sereinXH

关注

29
点赞
踩
27

收藏

觉得还不错? 一键收藏
0
评论
算法 Hw3

的子集，散列到到同一槽位。对于这个槽位的链表，使用链接法散列的查找，最坏情况需遍历该链表，此时的时间代价为。先在线性时间内确定输入序列中最大的元素，以确定所有元素的最高位。再按最低有效位进行排序。，将第一个符合要求的下标记作。，所以一定存在一个大小为。的时间将数组排好序。于是存在至少一个下标。
复制链接

扫一扫