《算法导论》学习（六）----概率分析和随机算法

SigmaBull

已于 2022-09-29 11:21:49 修改

阅读量893

点赞数 3

分类专栏：数据结构与算法文章标签：算法学习

于 2022-09-02 13:39:26 首次发布

本文链接：https://blog.csdn.net/weixin_52042488/article/details/126650005

版权

数据结构与算法专栏收录该内容

20 篇文章 8 订阅

订阅专栏

文章目录

前言
一、算法中的概率分析与随机算法
- 1.概率分析
- 2.随机算法
二、随机序列的生成（C代码）
三、在线应聘问题
总结

前言

在算法设计中，我们需要使用概率论相关的数学工具，为我们设计能够解决实际问题的优良算法。

本文主要讲解了概率与随机在算法中的应用，以及如何生成随机序列，最后给出了一个运用概率分析的算法设计。

一、算法中的概率分析与随机算法

1.概率分析

概率分析是在问题分析中应用概率的理念。一般的我们找到或者假设输入的分布，根据分布的概率模型进行概率分析，计算出一个平均运行时间。此类型的运行时间称为平均情况运行时间。

概率分析的关键是确认输入的分布
1.对于有些情况，我们可以对所有可能输入的集合做某种假定，然后采用概率分析来设计一个高效的算法，并加深对问题的认识。
2.对于另外一些情况，我们不能描述一个合理的输入分布，因此我们不能使用概率分析。

2.随机算法

随机算法是将任意输入随机化的算法。区别于概率分析，随机算法的随机不是依赖于输入的随机分布，而是依赖于算法的随机性。也可以说，即使输入是最坏的情况，那么通过随机算法的随机化，最后输入的数组并不是最坏的情况。而随机算法产生最坏随机数组的概率是很低的。

当分析一个随机算法的运行时间时，我们以运行时间的期望来刻画。我们将随机算法的运行时间称为期望运行时间，以此来区分那些输入是随机的算法。

一般而言：
1.当概率分布是在算法的输入上的时候，我们讨论平均情况运行时间。
2.当概率分布发生在算法本身上时，即算法本身做出随机选择，我们讨论期望运行时间。

二、随机序列的生成（C代码）

随机序列的生成算法就是一种随机算法。
这里介绍了一种生成随机序列的随机算法，就是将原输入序列随机化的算法的C语言实现。

#include<stdio.h>
#include<stdlib.h>
#include<time.h>


#define SIZE  10//定义数据量的大小 

/*
用来实现归并功能
归并的过程就是一次排序的过程
归并的对象是两个已经排好序的数组
那么最微元的时候
归并的对象是一个数据或者是两个数据
对于一个单数据的数组 
归并函数就是直接不作处理，返回
对于两个单数据的数组 
归并就是对它们排好序，返回一个两个元素的有序数组 
对于两个多数据的有序数组
归并就是将它们合并为一个有序的数组 
*/ 
void merge(int *y,int *x,int a,int b,int c)
{
	//若是一个单数据的数组就不做处理，直接返回 
	if(a==c)
	{
		return;
	} 
	int n1;
	n1=b-a+1;//分割的第一个顺序序列大小 
	int n2;
	n2=c-b;//分割的第二个顺序序列大小 
	int x1[n1];//为两个顺序序列分配空间 
	int x2[n2];
	int y1[n1];
	int y2[n2];
	int i=0;
	int j,k;
	j=n1-1;//为两个顺序序列的合并，提供位置指针 
	k=n2-1;
	//从原始数据中提取两个顺序序列 
	for(i=0;i<n1;i++)
	{
		x1[i]=x[i+a];
		y1[i]=y[i+a];
	}
	for(i=0;i<n2;i++)
	{
		x2[i]=x[i+b+1];
		y2[i]=y[i+b+1];
	}
	//将提取的两个顺序序列合并为一个顺序序列于原存储空间 
	for(i=c;i>=a;i--)
	{
		//两个序列都到底，就退出 
		if(j<0&&k<0)
		{
			break;
		}
		//一个序列到底，另外一个序列没有到底，那就可以直接赋值，因为两个序列自身都是有序序列 
		else if(j>=0&&k<0)
		{
			x[i]=x1[j];
			y[i]=y1[j];
			j--;//行进到序列下一个元素 
		}
		else if(j<0&&k>=0)
		{
			x[i]=x2[k];
			y[i]=y2[k];
			k--;
		}
		//两个序列都没有到底，那么就是谁大谁先在前 
		else 
		{
			if(x1[j]>=x2[k])
			{
				x[i]=x1[j];
				y[i]=y1[j];
				j--;
			}
			else
			{
				x[i]=x2[k];
				y[i]=y2[k];
				k--;
			}
		}
	}
	return;
}

/*
用来实现分治功能
该函数就是通过递归，调用自己的方式
将原始数据的数组分解为最小元
每一个最小元是两个数据或者一个数据
然后再结合归并程序
进行排序功能 
*/ 
void merge_sort(int *y,int *x,int a,int c)
{
	int b;
	b=(a+c)/2;//二分数据
	//如果数据分割至一个或者两个，说明已经是最小微元，直接开始归并 
	if(a==b||b==c)
	{
		merge(y,x,a,b,c);
		return;
	}
	//没有分割至最小微元，调用递归再次分割 
	else
	{
		merge_sort(y,x,a,b);//利用提前计算好的b进行数据二分 
		merge_sort(y,x,b+1,c);
		merge(y,x,a,b,c);//最后分割完要执行归并，排序且合并 
		return;
	}
}




int main()
{
	int i=0;
	
	/*
	生成输入序列，序列是从0开始加1递增的有序序列 
	*/
	int *y; 
	y=(int *)malloc(SIZE*sizeof(int));//动态分配宏定义指定的内存空间 
	for(i=0;i<SIZE;i++)
	{
		y[i]=i;
	}
	printf("模拟的有序序列如下：\n");
	for(i=0;i<SIZE;i++)//打印有序序列 
	{
		printf("%d ",y[i]);
	}
	printf("\n");
	
	
	/*
	生成并打印随机序列 
	*/
	int *x;
	x=(int *)malloc(SIZE*sizeof(int));//动态分配宏定义指定的内存空间 
	srand((unsigned)time(NULL));//生成与时间有关的随机种子 
	for(i=0;i<SIZE;i++)//生成宏定义指定大小的1-1000的随机数 
	{
		x[i]=rand()%1000;
	}
	printf("生成的随机序列如下:\n"); 
	for(i=0;i<SIZE;i++)//打印随机序列 
	{
		printf("%d ",x[i]);
	}
	printf("\n");
	
	
	/*
	对随机序列排序，根据排序后的随机序列的索引一一对应将原输入的有序序列随机化 
	*/
	merge_sort(y,x,0,(SIZE-1));//进行排序 
	
	
	/*
	打印结果 
	*/
	printf("排序后的随机序列为：\n");
	for(i=0;i<SIZE;i++)//打印排序好的数据 
	{
		printf("%d ",x[i]);
	}
	printf("\n");
	printf("随机化后的有序序列为：\n");
	for(i=0;i<SIZE;i++)//打印排序好的数据 
	{
		printf("%d ",y[i]);
	}
	printf("\n");
	
	free(y);//释放动态生成的内存
	free(x); 
	return 0;
}

执行结果如下P:
在这里插入图片描述
该算法的一部分需要进行排序，这里采用了前面文章讲解过的归并排序。

三、在线应聘问题

1.问题描述

某公司需要招聘一个员工，现有众多人前来面试，招聘官需要考虑如下问题：

1.想要招到最好的那个
2.尽可能的减少面试次数

那么面试需要一个策略，在找到尽可能最好的面试者的同时，也尽可能地减少面试次数。

2.算法分析

（1）策略

我们采用如下策略：
选择一个整数k， $(\left \lfloor {k={\frac{n}{e}}} \right \rfloor)$ ，其中 $n 是参加面试的总人数， e 是自然常数$ 。面试并拒绝前k个，并且为前k个打分，得到前k个的最高分M。然后从第k+1个应聘者开始，聘用那个分数比M高的第一个人。如果到最后都没有发现比M高的人，那么直接聘用最后一个面试者。

（2）简单理论----概率分析

根据概率论推导，我们可以得到面试得到最优者的概率不等式：
$\frac{k}{n}(ln{n}-lnk)\leqslant P(S)\leqslant \frac{k}{n}(ln(n-1)-ln(k-1))$
我们根据微积分的知识，可以得到结论：
$当k=\frac{n}{e}时，概率下界最大，我们至少有\frac{1}{e}的概率成功雇佣最好的应聘者。$

（3）具体推导

在这里插入图片描述

3.C代码

#include<stdio.h>
#include<stdlib.h>
#include<time.h>


#define SIZE  50//定义数据量的大小 
#define e 2.718281828


int hire(int *x,int k,int n)
{
	int i=0;
	int bestscore=-1;
	for(i=0;i<k;i++)
	{
		if(x[i]>bestscore)
		{
			bestscore=x[i];
		}
	}
	for(i=k;i<n;i++)
	{
		if(x[i]>bestscore)
		{
			return (i+1);
		}
	}
	return n;
}


int main()
{
	int i=0;
	int k=0;
	int person;
	
	/*
	生成并打印随机序列 
	*/
	int *x;
	x=(int *)malloc(SIZE*sizeof(int));//动态分配宏定义指定的内存空间 
	srand((unsigned)time(NULL));//生成与时间有关的随机种子 
	for(i=0;i<SIZE;i++)//生成宏定义指定大小的1-1000的随机数 
	{
		x[i]=rand()%1000;
	}
	printf("生成的随机序列如下:\n"); 
	for(i=0;i<SIZE;i++)//打印随机序列 
	{
		printf("%d ",x[i]);
	}
	printf("\n");
	
	
	/*
	计算出k值 
	*/
	k=SIZE/e;
	printf("得到的k值为：%d\n",k);
	person=hire(x,k,SIZE);//进行招聘
	
	
	/*
	打印结果 
	*/
	printf("得到的第%d个应聘者,分数为：%d\n",person,x[person-1]);
	
	//释放动态生成的内存
	free(x); 
	return 0;
}