2020杭电暑期多校01 06 - Finding a MEX (HDU6756) 分块

最新推荐文章于 2023-07-21 21:50:34 发布

hzh2019

最新推荐文章于 2023-07-21 21:50:34 发布

阅读量181

点赞数

分类专栏： 2020杭电暑期多校

本文链接：https://blog.csdn.net/henry2k888/article/details/107607813

版权

2020杭电暑期多校专栏收录该内容

3 篇文章 0 订阅

订阅专栏

20200721005922

2020杭电暑期多校01 06 - Finding a MEX (HDU6756) 分块

一、题意

给定一个 $n$ 点 $m$ 边的无向图 $G = (V, E)$ ，每个节点 $u$ 有点权值 $A_u$ 。

于是每个节点就有【邻居点权值的集合】 $S_u = \{A_v | (u,v)\in E\}$ ，即集合中是 $u$ 的各邻居点 $v$ 的权值。

最后定义节点 $u$ 的 MEX 值为最小的不存在于 $S_u$ 中的非负整数。

有 $q$ 次操作，每次要么修改某一点 $u$ 的权值，要么查询某一点 $u$ 的 MEX 值。

$T\leq 10; n\leq 10^5; m\leq 10^5; q\leq 10^5; 各点权值\leq 10^9;$

（注：本文中的节点数 $n$ 、边数 $m$ 均不区分大小写，大小写混用了……）

二、赛上TLE做法（优化不足够）

首先我们可以对每个节点 $u$ 维护 $S_u$ 的权值线段树，总共 $n$ 棵。即，我们把 $S_u$ 看做 multiset （集合内元素允许重复存在），线段树第 $i$ 个叶子（ $0\leq i\leq 10^9$ ）维护的是权值 $i$ 出现了几次，线段树区间的含义是对应叶子所代表权值的出现次数的最小值。这样，

修改一个节点 $u$ 的权值时，只需从其所有邻居各自的权值线段树中对原权值的次数减一、对新权值的次数加一。
查询一个节点 $u$ 的 MEX 值时，在它自己的权值线段树上逐层向下，每层当左子区间 $[l, m i d]$ 线段树值为 $0$ （表示此区间内对应叶子所代表权值的出现次数的最小值为 $0$ ，即存在某权值 $l\leq value\leq mid$ 出现次数为零、因而不在 $S_u$ 中）就只进入左子区间内查找、否则就只进入右子区间内查找。

（上面算是权值线段树基础知识）

然而，我们发现，每个节点 $u$ 的 MEX 值不可能超过其度数（邻居数） $deg_u$ ，因为，每个小于其 MEX 值的非负整数一定是 $u$ 的至少一个邻居的权值（由 MEX 值定义知），而 $u$ 只有 $deg_u$ 个邻居。因此，上述每棵权值线段树不需要 $O(10^9)$ 个叶子，只需 $deg_u+1)$ 个，其中第 $deg_u$ 个叶子改为维护大于等于 $deg_u$ 的权值出现了几次，即可决定 MEX 值。需要注意的是，此题中操作不包括对连边的修改，因此每个节点的度数是不变的。由于 $2m=\sum_{u\in V} \deg_u$ （无向图的性质），叶子总数为 $\sum_{u\in V}(\deg_u +1)=2m+n\leq 3*10^5$ ，则线段树只需开 $1.2*10^6$ 个节点。

赛上已经考虑到，即使这样做仍有可能超时：如果其中 $n=10^5$ ，几乎全部节点都与某节点 $u_0$ 连边，那么单次修改此节点权值就需要在 $O(10^5)$ 棵线段树上做单点修改；若 $q=10^5$ 次询问几乎都做这件操作，则单点修改总次数达到 $O(10^{10})$ 。然而却不知道怎样优化。

三、题解的优化（放弃）

题解也应用了上一章第二段的优化，使权值线段树们的总节点数可控。

对于上一章第三段提出的特别极端而难以应对的可能输入数据，我们发现问题本质在于度数大的节点（以下简称大节点）在修改权值时邻居太多、改不完它们的树。题解提出，这些大节点的数量是有限的，因此，让别的点查询时直接访问这些大节点来取值的耗时更短。具体来说，由于 $\sum_{u\in V} \deg_u=2m\leq 2*10^5$ ，因此度数大于 $MAX\_DEG$ 的节点不可能超过 $\frac{2m}{MAX\_DEG}$ 个，它们可被视为大节点，其余视为小节点。我们令每个节点（无论大小）的权值线段树都只存储其邻居中的小节点的权值信息，

修改小节点的权值时，去修改其所有邻居（最多 $MAX\_DEG$ 个）的权值线段树（记录邻居中的小节点的信息，因此叶子数上限大于等于 $N-350\approx N$ ）：每次操作的复杂度为 $O(MAX\_DEG\cdot\log N)$ ；
修改大节点的权值时，直接修改自己的权值：每次操作的复杂度为 $O (1)$ ；
查询节点的 MEX 值时，需要合并自己权值线段树上的信息以及邻居中的大节点的信息，我的做法是：
1. 先逐个查询邻居中的大节点的信息，将各值临时存入自己的权值线段树： $O(\frac{2m}{MAX\_DEG}\cdot\log N)$ ；
2. 在自己的权值线段树（同上，叶子数约为 $N$ ）上查询： $O(\log N)$ ，
3. 再逐个查询邻居中的大节点的信息，把临时存入的各值从自己的权值线段树上删去： $O(\frac{2m}{MAX\_DEG}\cdot\log N)$ ；
每次操作的复杂度为 $O(\frac{4m}{MAX\_DEG}\cdot\log N)$ ；

因此一次操作的最大的可能复杂度为 $O(\max(MAX\_DEG,\frac{4m}{MAX\_DEG})\cdot\log N)$ ；令 $MAX\_DEG==\frac{4m}{MAX\_DEG}$ 得 $MAX\_DEG$ 取 $KaTeX parse error: Undefined control sequence: \root at position 1: \̲r̲o̲o̲t̲\of{4m}\approx6…$ 最佳，则一次操作的最大的可能复杂度为 $KaTeX parse error: Undefined control sequence: \root at position 3: O(\̲r̲o̲o̲t̲\of{4m}\cdot\lo…$ 。

因此总复杂度为 $KaTeX parse error: Undefined control sequence: \root at position 9: O(q\cdot\̲r̲o̲o̲t̲\of{4m}\cdot\lo…$ ， $10^5\cdot 640\cdot \log (10^5) = 1.08*10^9$ 。（由于常数较大，上述推导保留了常数）。

（题解使用的界线是 $350$ ，然而 $350^2\geq 1*10^5$ ，我猜测作者忽略了边数应该乘二）。

我又想到，对于查询节点 $u$ 的 MEX 值的操作，还可以这样实现：

在 $u$ 自己的线段树上查询，得到只考虑邻居中的小节点时的 MEX 值，记为 $a n s$ ；
将邻居中的大节点的权值排序，方便后续比对；
将当前答案 $a n s$ 与邻居中的大节点的权值作比较，如果 $a n s$ 出现了，则将线段树权值搜索范围缩小至 $ans+1,\deg_u]$ ；
重复步骤3，直至找到答案；

则每次查询操作的复杂度降为
$O(\frac{2m}{MAX\_DEG}\log\frac{2m}{MAX\_DEG} + \frac{2m}{MAX\_DEG}\cdot(\log\frac{2m}{MAX\_DEG}+\log N)) \\=O( \frac{2m}{MAX\_DEG}\cdot(\log\frac{4m}{MAX\_DEG}+\log N))$
更难以继续分析，放弃。

四、网上找到的分块做法

参考资料： https://www.cnblogs.com/dysyn1314/p/13357864.html

本章是对上述博客的整理。

对于单点修改、区间查询问题，如果瓶颈出现在修改（即修改次数较多），可以考虑把线段树改成分块。根据第二、三章的分析，可对每个节点维护一套分块，存储其邻居的权值出现情况，且每个节点 $u$ 的分块占用空间只需 $deg_u+1$ 。

具体来说，对每个结点 $u$ ，维护两个 vector（C++）（总共就需要两个 vector 数组）：

cnt[u][x] 表示节点 $u$ 有多少个邻居的权值为 $x$ ，显然 cnt[u] 的第二维大小为 $deg_u+1$ ；
block_cnt[u][x/B] 表示对 cnt[u] 以 $B$ 为子块大小进行分块后，第 $\lfloor\frac{x}{B}\rfloor$ 块中（记录 $\lfloor\frac{x}{B}\rfloor , \lfloor\frac{x}{B}\rfloor+B-1 ]$ 内的非负整数情况）有多少个数出现过；

那么，修改一个邻居的复杂度就降至 $O (1)$ 了，只需增减 cnt[][] 的值，并在其增至 $1$ 或减至 $0$ 时对 block_cnt[][] 进行增减。

接下来研究如何应对第二章第三段提出的特别极端的可能输入数据。

设分块的子块大小为 $B$ 、那么块数为 $O(\frac{\max(\deg_u+1)}{B})=O(\frac{N}{B})$ ；设我们选出的大节点的个数为 $C$ 、那么小节点的最大度数为 $O(\frac{N}{C})$ 。我们的策略是

当修改小节点的权值时，直接更新其各邻居的分块： $O(\frac{N}{C})$ ；
当修改大节点的权值时，怎么更新那么多邻居节点的分块？不更新了，等到某邻居被查询前再主动更新！当然，每个节点就要再开一个 vector 记录自己分块中存储的邻居中的大节点的旧权值以方便比对、修改。 $O (1)$ 。

因此，单次修改操作复杂度为 $O(\frac{N}{C})$ 。

另外，这篇博客的解法同样将节点分为大节点和小节点，但不再规定分块只存邻居中的小节点的权值出现情况了（而是所有邻居都存）。那么，查询时只要做两件事：

先更新大邻居的信息： $O (C)$ ，其中 $C$ 为（被我们选出的）大节点的个数；
再在分块中查询： $O(\frac{N}{B}+B)$ 。

因此，单次查询操作的复杂度： $(C+\frac{N}{B}+B)$ 。

显然，取 $KaTeX parse error: Undefined control sequence: \root at position 5: B=C=\̲r̲o̲o̲t̲\of{N}$ 最佳。因此，初始化 $O (N + M)$ 、单次修改操作 $KaTeX parse error: Undefined control sequence: \root at position 3: O(\̲r̲o̲o̲t̲\of{N})$ 、单次查询操作 $KaTeX parse error: Undefined control sequence: \root at position 4: O(3\̲r̲o̲o̲t̲\of{N})$ ，总复杂度 $KaTeX parse error: Undefined control sequence: \root at position 15: O(N+M+q\cdot 3\̲r̲o̲o̲t̲\of{N})$ 。

五、总结

对于每个节点，我们要记录它邻居的权值出现信息、且这一信息动态可变，于是要记录次数。

一方面，我们发现，对于每个节点 $u$ ，其需要分别记录次数的权值（非负整数）不需要是 $0,10^9]$ ，而只需要 $0,\deg_u]$ ；另一方面，在这 $0,\deg_u]$ 中如何快速在其中找出 MEX，我们又使用线段树或分块进行进一步优化。

然后TLE了。我们想到，度数较大的节点的权值修改操作会大量耗时，而这类节点的数量有限。于是我们不让这些大节点去及时更新所有邻居的线段树或分块，而是让某邻居需要用到时再跑来问自己。

六、AC代码

#include<cstdio>
#include<vector>
#include<string.h>
//#include<utility>

const int B=350;

int A[100005];

std::vector<int> neighbors[100005];
int deg[100005];

typedef std::pair<int,int> pii;
std::vector<pii> big_neighbors[100005];

std::vector<int> cnt[100005];
std::vector<int> block_cnt[100005];

void add1(int u , int x){  // add value x once more into the data structure (storing information of neighbors) of node u.
    if(x>deg[u]) x=deg[u];
    ++cnt[u][x];
    if(cnt[u][x]==1) ++block_cnt[u][x/B];
}

void delete1(int u , int x){  // don't use name "delete"
    if(x>deg[u]) x=deg[u];
    --cnt[u][x];
    if(cnt[u][x]==0) --block_cnt[u][x/B];
}

int main(){
    int T;
    scanf("%d" , &T);
    while(T--){
        int n,m;
        scanf("%d%d" , &n , &m);
        for(int i=1 ; i<=n ; ++i) scanf("%d" , &A[i]);

        for(int u=1 ; u<=n ; ++u) neighbors[u].clear();
        memset(deg , 0 , sizeof deg);
        for(int i=0 ; i<m ; ++i){
            int u,v;
            scanf("%d%d" , &u , &v);
            neighbors[u].push_back(v);
            neighbors[v].push_back(u);
            ++deg[u];
            ++deg[v];
        }

        for(int u=1 ; u<=n ; ++u) big_neighbors[u].clear();
        for(int u=1 ; u<=n ; ++u){
            cnt[u].clear();
            cnt[u].resize(deg[u]+1);  // resize() set those new elements as zero
            block_cnt[u].clear();
            block_cnt[u].resize(deg[u]/B + 1);  // not ((deg[u]+1)/B);

            for(int i=0 ; i<neighbors[u].size() ; ++i){
                int v = neighbors[u][i];
                add1(u,A[v]);
                if(deg[v]>B) big_neighbors[u].push_back( std::make_pair(v,A[v]) );
            }
        }

        int q;
        scanf("%d" , &q);
        while(q--){
            int ope;
            scanf("%d" , &ope);
            if(ope==1){
                int u, x;
                scanf("%d%d" , &u , &x);
                if(deg[u]<=350){
                    for(int i=0 ; i<neighbors[u].size() ; ++i){
                        int v = neighbors[u][i];
                        delete1(v , A[u]);
                        add1(v , x);
                    }
                }
                A[u]=x;
            }else{
                int u;
                scanf("%d" , &u);

                // update the data structure of u
                for(int i=0 ; i<big_neighbors[u].size() ; ++i){
                    int v = big_neighbors[u][i].first;
                    int old_a = big_neighbors[u][i].second;
                    if(old_a != A[v]){
                        delete1(u , old_a);
                        add1(u , A[v]);
                        big_neighbors[u][i].second = A[v];
                    }
                }

                // query MEX
                for(int L=0 ; L<=deg[u] ; L+=B){
                    int R = L+B-1;
                    if(R>deg[u]) R=deg[u];
                    if(block_cnt[u][L/B] == R-L+1) continue;

                    for(int i=L ; i<=R ; ++i){
                        if(cnt[u][i]==0){
                            printf("%d\n" , i);
                            break;
                        }
                    }
                    break;
                }
            }
        }
    }
    return 0;
}

hzh2019

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
2020杭电暑期多校01 06 - Finding a MEX (HDU6756) 分块

202007210059222020杭电暑期多校01 06 - Finding a MEX (HDU6756) 分块一、题意给定一个 nnn 点 mmm 边的无向图 G=(V,E)G=(V,E)G=(V,E)，每个节点 uuu 有点权值 AuA_uAu。于是每个节点就有【邻居点权值的集合】Su={Av∣(u,v)∈E}S_u = \{A_v | (u,v)\in E\}Su={Av∣(u,v)∈E}，即集合中是 uuu 的各邻居点 vvv 的权值。最后定义节点 uuu 的 MEX 值为最小
复制链接

扫一扫