【学习笔记】Berlekamp-Massey算法

最新推荐文章于 2025-03-28 22:15:31 发布

cz_xuyixuan

最新推荐文章于 2025-03-28 22:15:31 发布

阅读量2.2w

点赞数 25

分类专栏：【类型】学习笔记【算法】Berlekamp-Massey算法文章标签：【类型】学习笔记

本文链接：https://blog.csdn.net/qq_39972971/article/details/80725873

版权

【算法】Berlekamp-Massey算法同时被 2 个专栏收录

9 篇文章

订阅专栏

【类型】学习笔记

6 篇文章

订阅专栏

【算法简介】

Berlekamp-Massey算法，常简称为BM算法，是用来求解一个数列的最短线性递推式的算法。
BM算法可以在\(O(N^2)\)的时间内求解一个长度为\(N\)的数列的最短线性递推式。
在当今OI竞赛界，尚没有很多BM算法的应用，但在一些输入的数很少的题目中，BM能够成为发掘题目性质的一大助力，甚至有可能直接解出答案的线性递推式，不失为一种不错的工具。

【算法流程】

对于数列\(\{a_1,a_2,a_3,...,a_n\}\)，我们称数列\(\{r_1,r_2,r_3,...,r_m\}\)为其线性递推式当且仅当\(a_i=\sum_{j=1}^{m}r_j*a_{i-j}\)对于任意\(m+1≤i≤n\)均成立。
若数列\(\{a_1,a_2,a_3,...,a_n\}\)的线性递推式\(\{r_1,r_2,r_3,...,r_m\}\)还满足\(m\)是所有该数列的线性递推式中最小的，则称\(\{r_1,r_2,r_3,...,r_m\}\)为数列\(\{a_1,a_2,a_3,...,a_n\}\)的最短线性递推式。
现在考虑我们已经求得了\(\{a_1,a_2,a_3,...,a_{i-1}\}\)的最短线性递推式\(\{r_1,r_2,r_3,...,r_m\}\)，如何求得\(\{a_1,a_2,a_3,...,a_i\}\)的最短线性递推式。
定义\(\{a_1,a_2,a_3,...,a_{i-1}\}\)的最短线性递推式\(\{r_1,r_2,r_3,...,r_m\}\)为当前递推式，记递推式被更改的次数为\(cnt\)，第\(i\)次更改后的递推式为\(R_i\)，特别地，定义\(R_0\)为空，那么当前递推式应当为\(R_{cnt}\)。
记\(delta_i=a_i-\sum_{j=1}^{m}r_j*a_{i-j}\)，其中\(\{r_1,r_2,r_3,...,r_m\}\)为当前递推式，显然若\(delta_i=0\)，那么当前递推式就是\(\{a_1,a_2,a_3,...,a_i\}\)的最短线性递推式。
否则，我们认为\(R_{cnt}\)在\(a_i\)处出错了，定义\(fail_i\)为\(R_i\)最早的出错位置，则有\(fail_{cnt}=i\)。
考虑对\(R_{cnt}\)进行修改，使其变为\(R_{cnt+1}\)，并在\(a_i\)处同样成立。
若\(cnt=0\)，这意味着\(a_i\)是序列中第一个非零元素，我们可以令\(R_{cnt+1}=\{0,0,0,...,0\}\)，即用\(i\)个0填充线性递推式，此时由于不存在\(j\)使得\(m+1≤j≤i\)，因此\(R_{cnt+1}\)显然为\(\{a_1,a_2,a_3,...,a_i\}\)的线性递推式，并且由于\(a_i\)是序列中第一个非零元素，不难证明\(R_{cnt+1}\)也是\(\{a_1,a_2,a_3,...,a_i\}\)的最短线性递推式。
否则，即\(cnt>0\)，考虑\(R_{cnt-1}\)出错的位置\(fail_{cnt-1}\)，记\(mul=\frac{delta_i}{delta_{fail_{cnt-1}}}\)。
我们希望得到数列\(R'=\{r'_1,r'_2,r'_3,...,r'_{m'}\}\)，使得\(\sum_{j=1}^{m'}r'_j*a_{k-j}=0\)对于任意\(m'+1≤k≤i-1\)均成立，并且\(\sum_{j=1}^{m'}r'_j*a_{i-j}=delta_i\)。如果能够找到这样的数列\(R'\)，那么令\(R_{cnt+1}=R_{cnt}+R'\)即可（其中\(+\)定义为各位分别相加）。
数列\(R'\)可以是下述数列：\(\{0,0,0,...,0,mul,-mul*R_{cnt-1}\}\)即填充\(i-fail_{cnt-1}-1\)个零，然后将数列\(\{1,-R_{cnt-1}\}\)的\(mul\)倍放在后面。此时有\(\sum_{j=1}^{m'}r'_j*a_{i-j}=delta_{fail_{cnt-1}}*mul=delta_i\)，并且\(\sum_{j=1}^{m'}r'_j*a_{k-j}=0\)对于任意\(m'+1≤k≤i-1\)均成立。
故令\(R_{cnt+1}=R_{cnt}+R'\)即可。
在最坏情况下，我们可能需要对数列进行\(O(N)\)次修改，因此该算法的时间复杂度为\(O(N^2)\)。

【一组实例】

以数列\(\{1,2,4,9,20,40,90\}\)为例，我们来具体地理解一下算法流程。
初始时，我们有\(R_0=\{\},cnt=0\)。
\(i=1\)时，将\(a_1=1\)代入递推式，得到\(delta_1=1\)，\(R_0\)在\(i=1\)时出错，记\(fail_0=1\)。由于此时\(cnt=0\)，我们将递推式修改为\(R_1=\{0\}\)。
\(i=2\)时，将\(a_2=2\)代入递推式，得到\(delta_2=2\)，\(R_1\)在\(i=2\)时出错，记\(fail_1=2\)。此时\(mul=2\)，可以构造得到\(R'=\{2\}\)，递推式被修改为\(R_2=\{2\}\)。
\(i=3\)时，将\(a_3=4\)代入递推式，得到\(delta_3=0\)，\(R_2\)没有出错。
\(i=4\)时，将\(a_4=9\)代入递推式，得到\(delta_4=1\)，\(R_2\)在\(i=4\)时出错，记\(fail_2=4\)。此时\(mul=0.5\)，可以构造得到\(R'=\{0,0.5,0\}\)，递推式被修改为\(R_3=\{2,0.5,0\}\)。
\(i=5\)时，将\(a_5=20\)代入递推式，得到\(delta_5=0\)，\(R_3\)没有出错。
\(i=6\)时，将\(a_6=40\)代入递推式，得到\(delta_6=-4.5\)，\(R_3\)在\(i=6\)时出错，记\(fail_3=6\)。此时\(mul=-4.5\)，可以构造得到\(R'=\{0,-4.5,9\}\)，递推式被修改为\(R_4=\{2,-4,9\}\)。
\(i=7\)时，将\(a_7=90\)代入递推式，得到\(delta_7=9\)，\(R_4\)在\(i=7\)时出错，记\(fail_4=7\)。此时\(mul=-2\)，可以构造得到\(R'=\{-2,4,1,0\}\)，递推式被修改为\(R_5=\{0,0,10,0\}\)。
因此以数列\(\{1,2,4,9,20,40,90\}\)的递推式即为\(R_5=\{0,0,10,0\}\)。

【代码】

以下代码实现了求解给定\(N\)元数列在实数域上的最短线性递推式。
显然，BM算法只需要数域中每个非零元素均存在乘法逆元即可实现，读者不妨自行实现一下在模质数意义下的BM算法。

#include<bits/stdc++.h>
using namespace std;
const int MAXN = 2005;
const double eps = 1e-8;
template <typename T> void read(T &x) {
	x = 0; int f = 1;
	char c = getchar();
	for (; !isdigit(c); c = getchar()) if (c == '-') f = -f;
	for (; isdigit(c); c = getchar()) x = x * 10 + c - '0';
	x *= f;
}
int cnt, fail[MAXN];
double val[MAXN], delta[MAXN];
vector <double> ans[MAXN];
int main() {
	int n; read(n);
	for (int i = 1; i <= n; i++)
		scanf("%lf", &val[i]);
	for (int i = 1; i <= n; i++) {
		double tmp = val[i];
		for (unsigned j = 0; j < ans[cnt].size(); j++)
			tmp -= ans[cnt][j] * val[i - j - 1];
		delta[i] = tmp;
		if (fabs(tmp) <= eps) continue;
		fail[cnt] = i;
		if (cnt == 0) {
			ans[++cnt].resize(i);
			continue;
		}
		double mul = delta[i] / delta[fail[cnt - 1]];
		cnt++; ans[cnt].resize(i - fail[cnt - 2] - 1);
		ans[cnt].push_back(mul);
		for (unsigned j = 0; j < ans[cnt - 2].size(); j++)
			ans[cnt].push_back(ans[cnt - 2][j] * -mul);
		if (ans[cnt].size() < ans[cnt - 1].size()) ans[cnt].resize(ans[cnt - 1].size());
		for (unsigned j = 0; j < ans[cnt - 1].size(); j++)
			ans[cnt][j] += ans[cnt - 1][j];
	}
	for (unsigned i = 0; i < ans[cnt].size(); i++)
		cout << ans[cnt][i] << ' ';
	return 0;
}