随机取样(《编程珠玑》第12章)

随机取样问题,同《编程珠玑》上所讲,总共用了三种方法,在《编程珠玑(续)》中仍有介绍,会在后面补充。可以证明每种方法所选每个元素的概率都相等,都是m/n,这个可以根据公式推导而得,如下。

方法一:选择第一个数的概率为m/n,这是显而易见的,选择第二个数时,概率为:m/n*(m-1)/(n-1)+(n-m)/n*m/(n-1)=m/n,即等于第一个数没有选中,第二个数选中的概率和第一个数选中且第二个数选中的概率之和。选择第i个数的概率和上相似。

方法二:每次都从n个数中选一个数,选m次,因此,每个数被选中的概率相同,为m/n。

方法三:对于每一个数,如果在前m个位置,则表示被选中。在第一个位置上的概率为1/m,在第二个位置上的概率为(n-1)/n*1/(n-1)=1/n,即等于这个数不出现在第一个位置上,且出现在第二个位置上的概率,同样,出现在第i个位置上的概率为1/n,因此,一个数出现在前m个位置的概率为m/n。

至此,三种方法所产生的随机数的概率已经得到证明,算法代码和测试如下:

#include<iostream>
#include<algorithm>
#include<time.h>
#include<set>
using namespace std;

void genKnuth(int n,int m)
{
	srand(time(0));
	for(int i=0;i<n;i++)
	{
		if(rand()%(n-i)<m)
		{
			cout<<i<<endl;
			m--;
		}
	}
}

void genSets(int n,int m)
{
	srand(time(0));
	set<int> randSet;
	while(randSet.size()<m)
		randSet.insert(rand()%(n-1));
	set<int>::iterator iter=randSet.begin();
	for(;iter!=randSet.end();++iter)
		cout<<*iter<<endl;
}

void genShuf(int n,int m)
{
	srand(time(0));
	int *A=new int[n];
	for(int i=0;i<n;i++)
		A[i]=i;
	for(int i=0;i<n-1;i++)//注意这里不需要用i=n-1,此时只有一个数
		swap(A[i],A[i+rand()%(n-1-i)]);//rand()%0会出错!!!
	sort(A,A+m);
	for(int i=0;i<m;i++)
		cout<<A[i]<<endl;
}

int main()
{
	cout<<"***方法一:***"<<endl;
	genKnuth(100,10);
	cout<<"***方法二:***"<<endl;
	genSets(100,10);
	cout<<"***方法三:***"<<endl;
	genShuf(100,10);

	system("pause");
	return 0;
}


  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值