第4章 概率分布和随机分布
4.1 雇用问题
-
题目:代理公司帮你物色办公助理候选人,面试一个候选人支付代理公司1K。
-
策略:在面试完每个应聘者后,如果该应聘者比目前的办公助理更合适,就辞退当前的办公助理,然后雇佣新的。
-
伪代码:HIRE-ASSISTANT(n)
best = 0 for i = 1 to n interview candidate i if candidate i is better than candidate best best = i hire candidate i
-
最坏情形分析:当应聘者质量按出现次序严格递增时。此时雇佣n次,总费用为 O ( c k n ) O(c_kn) O(ckn)。
-
概率分析:对所有可能输出产生的运行时间取平均。称其为平均情况运行时间。
-
随机算法:一般地,如果一个算法的行为不仅由输入决定,而且也由随机数生成器产生的数字决定,则称这个算法是随机的。
4.2 指示器随机变量
-
指示器随机变量:
I A = { 1 , A 发 生 0 , A 不 发 生 I{A}=\left\{ \begin{array}{c} 1,A发生\\ 0,A不发生 \end{array} \right. IA={1,A发生0,A不发生 -
给定一个样本空间S和S中的一个时间A,设 X A = I { A } X_A=I\{A\} XA=I{A},那么 E [ X A ] = P r { A } E[X_A]=Pr\{A\} E[XA]=Pr{A}。
-
用指示器随机变量分析雇用问题问题:
X ( i ) = I { 应 聘 者 i 被 雇 佣 } = { 1 , 应 聘 者 i 被 雇 用 0 , 应 聘 者 i 不 被 雇 用 X(i)=I\{应聘者i被雇佣\}=\left\{ \begin{array}{c} 1,应聘者i被雇用\\ 0,应聘者i不被雇用 \end{array} \right. X(i)=I{应聘者i被雇佣}={1,应聘者i被雇用0,应聘者i不被雇用 -
E [ X ] = ln n + O ( 1 ) E[X]=\ln n+O(1) E[X]=lnn+O(1),平均只雇用 ln n \ln n lnn个人
4.3 随机算法
-
思想:随机排列应聘者,以加强所有排序都是等可能出现的性质。
-
伪代码:RANDOMIZED-HIRE-ASSISTANT(n)
randomly permute the list of candidates best = 0 for i = 1 to n interview candidate i if candidate i is better than candidate best best = i hire candidate i
-
随机排列数组:
- 方法一:为数组的每个元素
A
[
i
]
A[i]
A[i]赋一个随机的优先级
P
[
i
]
P[i]
P[i],然后依据优先级对数组A中的元素进行排序。
- 伪代码:PERMUTE-BY-SORTING(A)
n = A.length let P[1..n] be a new array for i = 1 to n P[i] = RANDOM(1,n^3) sort A, using P as sort keys
-
方法二:原址排列给定数组
-
伪代码:RANDOMIZE-IN-PLACE(A)
n = A.length for i = 1 to n swap A[i] with A[RANDOM(i,n)]
-
- 方法一:为数组的每个元素
A
[
i
]
A[i]
A[i]赋一个随机的优先级
P
[
i
]
P[i]
P[i],然后依据优先级对数组A中的元素进行排序。