问题:
假设你希望以1/2概率输出0和1。你可以自由使用一个输出0和1的过程BIASED-RANDOM。它以概率p输出1,概率1-p输出0,其中0<p<1,但是p的值未知。请给出一个利用BIASED-RANDOM作为子程序的算法,返回一个无偏的结果,能以概率1/2返回0,以概率1/2返回1。作为p的函数,该算法的期望运行时间是多少。
解答:
该算法描述如下:
- 使用BIASED-RANDOM生成两个随机数x,y。
- 若x与y不相等,则返回x的值作为输出。
- 如果x与y相等,则重新进行步骤1。
正确性:
P {x = 1 and y = 0} = p * (1-p)
P {x = 0 and y = 1} = (1 - p) * p
易知,该函数返回1与返回0的概率相等,均为1/2。
复杂度分析:
记q=1-p,则总共进行i次Step1的概率为:
(2pq)i−1(1−2pq)
。
记X为总共进行Step1的次数,则:
E(X)=∑∞i=1i(2pq)(1−2pq)i−1=12pq
记算法消耗的时间为T(n),则有:
T(n)=O(1p(1−p))
C语言实现:
实现如下:
#include <stdio.h>
#include <stdlib.h>
#include <time.h>
#define P 20
int biased_random() {
int temp = rand() % 100;
if (temp < P) {
return 1;
}
return 0;
}
int unbiased_random() {
int x = biased_random();
int y = biased_random();
while (x == y) {
x = biased_random();
y = biased_random();
}
return x;
}
int main(int argc, char const *argv[])
{
srand(time(NULL));
int sum[2] = {0, 0};
for (int i = 0; i < 10000; i++) {
sum[biased_random()]++;
}
for (int i = 0; i < 2; ++i) {
printf("biased_random %d: %d\n", i, sum[i]);
}
sum[0] = 0;
sum[1] = 0;
for (int i = 0; i < 10000; i++) {
sum[unbiased_random()]++;
}
for (int i = 0; i < 2; i++) {
printf("unbiased_random %d: %d\n", i, sum[i]);
}
return 0;
}