根号算法与分块技巧-CSDN博客

导入

众所周知，我们熟悉的算法时间复杂度有常数级，对数级、线性级、次方级、指数级等等，其中为应对题目规模对时间复杂度的要求，我们一般要将算法的时间复杂度优化到对数级，但是实际上我们还有一种优化方法——根号算法，它的时间复杂度为 $\sqrt{n}$ 级，同样可以应对大部分的题目规模，并且具有相当大的可拓展性。和对数算法基本对应分治类似，根号算法也对应着一种操作，就是本篇博客要介绍的分块。

什么是分块？

分块顾名思义，就是将数据分为一块一块，然后在每一块中单独解决问题后累计答案。但是这么思考的话，将一个问题分开解决和一起解决好像没什么区别吧。如果你要是这么想，那你的分治法肯定没学到精髓，对于分块的另一项重要应用——莫队算法的学习理解也会有难度。

其实分块真正巧妙的地方在于：对于一次修改或询问，它所覆盖到的每一个完整的块我们都是可以做一个整体处理，将其打上或查询其修改标记（类似于线段树里的懒标记），而不是一个一个数据的操作，这样对于一个块的操作就能在O(1)的时间内完成；而左右两边没有没完全覆盖的区间因为数据不多（不会超过两个块的数据范围），直接暴力处理就行了。最后讨论下时间复杂度：假设我们共有n个数据，分块大小为m，那么最多只有 $\frac{n}{m}+1$ 个块；一次修改或查询最多执行O(1)*块数(m)+两个不完整块(<2*n/m)次，我们近似为 $m+\frac{n}{m}$ 次，这样很简单地利用均值不等式得到：当m取 $\sqrt{n}$ 时，执行次数最少，这也就是根号算法的含义所在，当然对于不同题目，我们对一个块的操作可能不能在O(1)的时间内完成，这样我们需要根据分块思想自己推导出最后的时间复杂度的公式，再利用均值不等式得到最佳分块的大小，关于分块大小这点可以参考国家队大佬的论文，分析得相当详细（2017年《非常规大小分块算法初探》----徐明宽），如果实在不会，那就每道题都取 $\sqrt{n}$ 吧，这样得到的时间复杂度也不会太差，也基本能够应对大部分的题面了。

上文只是非常模糊的讲了一下分块的基本思想，刚接触分块的读者肯定是无法立刻理解的，所以下面我们就一起来解决一道很经典的分块入门题目来更深入的理解这个算法：

题目链接：（https://loj.ac/problem/6278）

大意：给出一个长为n的数列，以及n个操作，操作涉及区间加法，询问区间内小于某个值x的元素个数。

下面我们以下面的一组数据为例：

为实现分块，我们需要储存一些数据：原数组num[n]，数据所在块序号pos[n]，块block[ $\sqrt{n}$ ]，修改标记tag[ $\sqrt{n}$ ]，其中pos[n]与block[ $\sqrt{n}$ ]可以预处理：（block也可用普通的二维数组代替，但用vector能支持如插入等更多操作，同时不只是vector，它可以是任何数据结构如set，map等，这样分块能维护的功能也就相应的增加了）。然后根据题目的询问，我们思考一下，如何快速知道一个序列中小于某个值的元素个数？直接暴力搜索？好像可行，但可惜多次搜索势必会爆时间。哎，其实我们用的优化方式真的不多，既然O(n)的时间复杂度不行，O(1)的时间复杂度又不可能实现，就只剩下O(logn)了，那就必然是二分法了。二分法要求整个序列是有序的，所以我们要先将序列排个序，不过要注意分块是分别在每一块中操作，所以排序也应该是分别在每一块中排序，这部分代码如下：

typedef long long ll; 
const int N = 50005;
int num[N], pos[N], tag[225];
vector<int> block[225];
int m;
······
此处是修改与查询函数，见下文
······
int main(){
    int n; 
    scanf("%d",&n);
    m = sqrt(n);
    for(int i=1; i<=n; i++)
        pos[i] = (i-1)/m+1; //预处理每个点所在的块
    for(int i=1; i<=n; i++) {
        scanf("%d",&num[i]);
        block[ pos[i] ].push_back(num[i]); //将数据num[i]存入所在的块pos[i] 
    }
    for(int i=1; i<=pos[n]; i++)
        sort(block[i].begin(),block[i].end()); //对每一块分别排序
    ······
    此处是读取询问的代码，省略
    ······
    return 0;
}

现在，数据已经成功被我们分好了块：

5 7 9

3 6 8

1 2 4

第一块第二块第三块

block[1]={5, 7, 9} block[2]={3, 6, 8} block[3]={1, 2 ,4}

接着，我们考虑如何实现区间修改。

仔细理解上文中的这句话：“覆盖到的每一个完整的块我们都是可以做一个整体处理，将其打上或查询其修改标记（类似于线段树里的懒标记）”。假定我们要在区间[3,8]加上一个值x，这个修改区间覆盖了整个第二块，然后还覆盖了第一块和第三块的一部分。那么，根据原则，我们直接将第二块打上标记：tag[2]+=x，表示第二块中每个值都要增加x；而对于没有完整覆盖的两块，我们直接将它的原数组加上x：num[3]、num[7]、num[8]+=x，但此时要注意我们修改了原数组的值，这样它们所在的块就不再是有序的了，我们要将其重新排序。

void resort(int pos) { //重新排序
    block[pos].clear();
    for (int i = (pos - 1) * m + 1; i <= pos * m; i++)
        block[pos].push_back(num[i]);
    sort(block[pos].begin(), block[pos].end());
}
void modify(int l, int r, int x) {
    if (pos[l] == pos[r]) {  //在同一块内,直接暴力修改
        for (int i = l; i <= r; i++) num[i] += x;
        //原数组被修改，需要清空此块重新插入进行排序
        resort(pos[l]);
    }
    else {
        //整块打上标记
        for (int i = L; i <= R; i++)
            tag[i] += x;
        //非整块直接暴力
        for (int i = l; i <= pos[l] * m; i++) num[i] += x;
            resort(pos[l]);
        for (int i = R * m + 1; i <= r; i++) num[i] += x;
            resort(pos[r]);
    }
}

最后的查询与修改异曲同工，对于每个完整块就采取上文讲的二分查找答案，不完整块还是直接暴力，只是要注意tag标记的影响就行了。

int query(int l, int r, ll v) {
    int ans = 0;
    if (pos[l] == pos[r]) {
        for (int i = l; i <= r; i++)
            if ((ll)num[i] + tag[pos[i]] < v)
                ans++;
        return ans;
    }
    //完整块二分查找答案
    for (int i = L; i <= R; ++i)
        ans += lower_bound(block[i].begin(), block[i].end(), v - tag[i]) - block[i].begin();
    //不完整块直接暴力
    for (int i = l; i <= pos[l] * m; i++)
        if ((ll)num[i] + tag[pos[i]] < v)
            ans++;
    for (int i = R * m + 1; i <= r; i++)
        if ((ll)num[i] + tag[pos[i]] < v)
            ans++;
    return ans;
}