《算法导论》学习(六)----概率分析和随机算法


前言

在算法设计中,我们需要使用概率论相关的数学工具,为我们设计能够解决实际问题的优良算法。

本文主要讲解了概率与随机在算法中的应用,以及如何生成随机序列,最后给出了一个运用概率分析的算法设计。


一、算法中的概率分析与随机算法

1.概率分析

概率分析是在问题分析中应用概率的理念。一般的我们找到或者假设输入的分布,根据分布的概率模型进行概率分析,计算出一个平均运行时间。此类型的运行时间称为平均情况运行时间

概率分析的关键是确认输入的分布
1.对于有些情况,我们可以对所有可能输入的集合做某种假定,然后采用概率分析来设计一个高效的算法,并加深对问题的认识。
2.对于另外一些情况,我们不能描述一个合理的输入分布,因此我们不能使用概率分析。

2.随机算法

随机算法是将任意输入随机化的算法。区别于概率分析,随机算法的随机不是依赖于输入的随机分布,而是依赖于算法的随机性。也可以说,即使输入是最坏的情况,那么通过随机算法的随机化,最后输入的数组并不是最坏的情况。而随机算法产生最坏随机数组的概率是很低的。

当分析一个随机算法的运行时间时,我们以运行时间的期望来刻画。我们将随机算法的运行时间称为期望运行时间,以此来区分那些输入是随机的算法。

一般而言:
1.当概率分布是在算法的输入上的时候,我们讨论平均情况运行时间
2.当概率分布发生在算法本身上时,即算法本身做出随机选择,我们讨论期望运行时间

二、随机序列的生成(C代码)

随机序列的生成算法就是一种随机算法
这里介绍了一种生成随机序列的随机算法,就是将原输入序列随机化的算法的C语言实现。

#include<stdio.h>
#include<stdlib.h>
#include<time.h>


#define SIZE  10//定义数据量的大小 

/*
用来实现归并功能
归并的过程就是一次排序的过程
归并的对象是两个已经排好序的数组
那么最微元的时候
归并的对象是一个数据或者是两个数据
对于一个单数据的数组 
归并函数就是直接不作处理,返回
对于两个单数据的数组 
归并就是对它们排好序,返回一个两个元素的有序数组 
对于两个多数据的有序数组
归并就是将它们合并为一个有序的数组 
*/ 
void merge(int *y,int *x,int a,int b,int c)
{
	//若是一个单数据的数组就不做处理,直接返回 
	if(a==c)
	{
		return;
	} 
	int n1;
	n1=b-a+1;//分割的第一个顺序序列大小 
	int n2;
	n2=c-b;//分割的第二个顺序序列大小 
	int x1[n1];//为两个顺序序列分配空间 
	int x2[n2];
	int y1[n1];
	int y2[n2];
	int i=0;
	int j,k;
	j=n1-1;//为两个顺序序列的合并,提供位置指针 
	k=n2-1;
	//从原始数据中提取两个顺序序列 
	for(i=0;i<n1;i++)
	{
		x1[i]=x[i+a];
		y1[i]=y[i+a];
	}
	for(i=0;i<n2;i++)
	{
		x2[i]=x[i+b+1];
		y2[i]=y[i+b+1];
	}
	//将提取的两个顺序序列合并为一个顺序序列于原存储空间 
	for(i=c;i>=a;i--)
	{
		//两个序列都到底,就退出 
		if(j<0&&k<0)
		{
			break;
		}
		//一个序列到底,另外一个序列没有到底,那就可以直接赋值,因为两个序列自身都是有序序列 
		else if(j>=0&&k<0)
		{
			x[i]=x1[j];
			y[i]=y1[j];
			j--;//行进到序列下一个元素 
		}
		else if(j<0&&k>=0)
		{
			x[i]=x2[k];
			y[i]=y2[k];
			k--;
		}
		//两个序列都没有到底,那么就是谁大谁先在前 
		else 
		{
			if(x1[j]>=x2[k])
			{
				x[i]=x1[j];
				y[i]=y1[j];
				j--;
			}
			else
			{
				x[i]=x2[k];
				y[i]=y2[k];
				k--;
			}
		}
	}
	return;
}

/*
用来实现分治功能
该函数就是通过递归,调用自己的方式
将原始数据的数组分解为最小元
每一个最小元是两个数据或者一个数据
然后再结合归并程序
进行排序功能 
*/ 
void merge_sort(int *y,int *x,int a,int c)
{
	int b;
	b=(a+c)/2;//二分数据
	//如果数据分割至一个或者两个,说明已经是最小微元,直接开始归并 
	if(a==b||b==c)
	{
		merge(y,x,a,b,c);
		return;
	}
	//没有分割至最小微元,调用递归再次分割 
	else
	{
		merge_sort(y,x,a,b);//利用提前计算好的b进行数据二分 
		merge_sort(y,x,b+1,c);
		merge(y,x,a,b,c);//最后分割完要执行归并,排序且合并 
		return;
	}
}




int main()
{
	int i=0;
	
	/*
	生成输入序列,序列是从0开始加1递增的有序序列 
	*/
	int *y; 
	y=(int *)malloc(SIZE*sizeof(int));//动态分配宏定义指定的内存空间 
	for(i=0;i<SIZE;i++)
	{
		y[i]=i;
	}
	printf("模拟的有序序列如下:\n");
	for(i=0;i<SIZE;i++)//打印有序序列 
	{
		printf("%d ",y[i]);
	}
	printf("\n");
	
	
	/*
	生成并打印随机序列 
	*/
	int *x;
	x=(int *)malloc(SIZE*sizeof(int));//动态分配宏定义指定的内存空间 
	srand((unsigned)time(NULL));//生成与时间有关的随机种子 
	for(i=0;i<SIZE;i++)//生成宏定义指定大小的1-1000的随机数 
	{
		x[i]=rand()%1000;
	}
	printf("生成的随机序列如下:\n"); 
	for(i=0;i<SIZE;i++)//打印随机序列 
	{
		printf("%d ",x[i]);
	}
	printf("\n");
	
	
	/*
	对随机序列排序,根据排序后的随机序列的索引一一对应将原输入的有序序列随机化 
	*/
	merge_sort(y,x,0,(SIZE-1));//进行排序 
	
	
	/*
	打印结果 
	*/
	printf("排序后的随机序列为:\n");
	for(i=0;i<SIZE;i++)//打印排序好的数据 
	{
		printf("%d ",x[i]);
	}
	printf("\n");
	printf("随机化后的有序序列为:\n");
	for(i=0;i<SIZE;i++)//打印排序好的数据 
	{
		printf("%d ",y[i]);
	}
	printf("\n");
	
	free(y);//释放动态生成的内存
	free(x); 
	return 0;
} 

执行结果如下P:
在这里插入图片描述
该算法的一部分需要进行排序,这里采用了前面文章讲解过的归并排序。

三、在线应聘问题

1.问题描述

某公司需要招聘一个员工,现有众多人前来面试,招聘官需要考虑如下问题:

1.想要招到最好的那个
2.尽可能的减少面试次数

那么面试需要一个策略,在找到尽可能最好的面试者的同时,也尽可能地减少面试次数

2.算法分析

(1)策略

我们采用如下策略:
选择一个整数k, ( ⌊ k = n e ⌋ ) (\left \lfloor {k={\frac{n}{e}}} \right \rfloor) (k=en),其中 n 是参加面试的总人数, e 是自然常数 n是参加面试的总人数,e是自然常数 n是参加面试的总人数,e是自然常数。面试并拒绝前k个,并且为前k个打分,得到前k个的最高分M。然后从第k+1个应聘者开始,聘用那个分数比M高的第一个人。如果到最后都没有发现比M高的人,那么直接聘用最后一个面试者。

(2)简单理论----概率分析

根据概率论推导,我们可以得到面试得到最优者的概率不等式:
k n ( l n n − l n k ) ⩽ P ( S ) ⩽ k n ( l n ( n − 1 ) − l n ( k − 1 ) ) \frac{k}{n}(ln{n}-lnk)\leqslant P(S)\leqslant \frac{k}{n}(ln(n-1)-ln(k-1)) nk(lnnlnk)P(S)nk(ln(n1)ln(k1))
我们根据微积分的知识,可以得到结论:
当 k = n e 时,概率下界最大,我们至少有 1 e 的概率成功雇佣最好的应聘者。 当k=\frac{n}{e}时,概率下界最大,我们至少有\frac{1}{e}的概率成功雇佣最好的应聘者。 k=en时,概率下界最大,我们至少有e1的概率成功雇佣最好的应聘者。

(3)具体推导

在这里插入图片描述
在这里插入图片描述

3.C代码

#include<stdio.h>
#include<stdlib.h>
#include<time.h>


#define SIZE  50//定义数据量的大小 
#define e 2.718281828


int hire(int *x,int k,int n)
{
	int i=0;
	int bestscore=-1;
	for(i=0;i<k;i++)
	{
		if(x[i]>bestscore)
		{
			bestscore=x[i];
		}
	}
	for(i=k;i<n;i++)
	{
		if(x[i]>bestscore)
		{
			return (i+1);
		}
	}
	return n;
}


int main()
{
	int i=0;
	int k=0;
	int person;
	
	/*
	生成并打印随机序列 
	*/
	int *x;
	x=(int *)malloc(SIZE*sizeof(int));//动态分配宏定义指定的内存空间 
	srand((unsigned)time(NULL));//生成与时间有关的随机种子 
	for(i=0;i<SIZE;i++)//生成宏定义指定大小的1-1000的随机数 
	{
		x[i]=rand()%1000;
	}
	printf("生成的随机序列如下:\n"); 
	for(i=0;i<SIZE;i++)//打印随机序列 
	{
		printf("%d ",x[i]);
	}
	printf("\n");
	
	
	/*
	计算出k值 
	*/
	k=SIZE/e;
	printf("得到的k值为:%d\n",k);
	person=hire(x,k,SIZE);//进行招聘
	
	
	/*
	打印结果 
	*/
	printf("得到的第%d个应聘者,分数为:%d\n",person,x[person-1]);
	
	//释放动态生成的内存
	free(x); 
	return 0;
} 

在这里插入图片描述

虽然我们得到的不是最大值,但是显然能达到分数高和应聘次数的均衡。


总结

由于笔者没有经历与概率分析和随机算法有关的实际项目,对于该方面的知识理解不深刻,希望各位指正。

  • 3
    点赞
  • 5
    收藏
    觉得还不错? 一键收藏
  • 打赏
    打赏
  • 2
    评论
评论 2
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包

打赏作者

SigmaBull

你的鼓励将是我创作的最大动力

¥1 ¥2 ¥4 ¥6 ¥10 ¥20
扫码支付:¥1
获取中
扫码支付

您的余额不足,请更换扫码支付或充值

打赏作者

实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值