Fisher-Yates Shuffle算法
基本思想就是从原始数组中随机取一个之前没取过的数字到新的数组中,具体如下:
1. 初始化原始数组和新数组,原始数组长度为n(已知);
2. 从还没处理的数组(假如还剩k个)中,随机产生一个[0, k)之间的数字p(假设数组从0开始);
3. 从剩下的k个数中把第p个数取出;
4. 重复步骤2和3直到数字全部取完;
即,第3步得到的p的序列就是一个随机打乱的序列。
代码如下:
void Fisher_Yates_Shuffle(vector<int>& vec_s, vector<int>& vec_t)
{
srand((unsigned)time(NULL));
int len = vec_s.size();
int k;
for(int i=0; i<len; i++)
{
k = rand()%vec_s.size();
vec_t.push_back(vec_s[k]);
vec_s.erase(vec_s.begin()+k);
}
}
时间复杂度为O(n),空间复杂度为O(n)。
Knuth-Durstenfeld Shuffle 算法
Knuth 和 Durstenfeld 在Fisher 等人的基础上对算法进行了改进,在原始数组上对数字进行交互,省去了额外O(n)的空间。该算法的基本思想和 Fisher 类似,每次从未处理的数据中随机取出一个数字,然后把该数字放在数组的尾部,即数组尾部存放的是已经处理过的数字。
算法步骤为:
1. 建立一个数组大小为 n 的数组 arr,分别存放 1 到 n 的数值;
2. 生成一个从 0 到 n - 1 的随机数 x;
3. 输出 arr 下标为 x 的数值,即为第一个随机数;
4. 将 arr 的尾元素和下标为 x 的元素互换;
5. 同2,生成一个从 0 到 n - 2 的随机数 x;
6. 输出 arr 下标为 x 的数值,为第二个随机数;
7. 将 arr 的倒数第二个元素和下标为 x 的元素互换;
……
如上,直到输出 m 个数为止
代码如下:
void Knuth_Durstenfeld_Shuffle(vector<int>&arr)
{
srand((unsigned)time(NULL));
for(int i=arr.size()-1; i>0;i--)
{
swap(arr[rand()%(i+1)], arr[i]);
}
}
算法时间复杂度为O(n),空间复杂度为O(1)。
随机数生成算法
线性同余法:
古老的LCG(linear congruential generator)代表了最好的伪随机数产生器算法。主要原因是容易理解,容易实现,而且速度快。这种算法数学上基于数学公式:
X(n+1) = (a * X(n) + c) % m
其中:
模m, m > 0
系数a, 0 < a < m
增量c, 0 <= c < m
原始值(种子) 0 <= X(0) < m
其中参数c, m, a比较敏感,或者说直接影响了伪随机数产生的质量。
一般而言,高LCG的m是2的指数次幂(一般232或者264),因为这样取模操作截断最右的32或64位就可以了。