NOIP2021 题解

最新推荐文章于 2024-06-28 13:03:48 发布

liuzhangfeiabc

最新推荐文章于 2024-06-28 13:03:48 发布

阅读量1.5k

点赞数 1

分类专栏：题解 NOIP系列文章标签： c++ 算法数据结构动态规划 NOIP

本文链接：https://blog.csdn.net/liuzhangfeiabc/article/details/121483687

版权

题解同时被 2 个专栏收录

10 篇文章 0 订阅

订阅专栏

NOIP系列

1 篇文章 0 订阅

订阅专栏

T1：两人轮流报数，规定所有含有 $7$ 的数字及其倍数都不能报出，每次询问给出上一个报的数，求下一个报的数是多少（或判断上一个报的数不合法）。
询问次数 $\leq 2 \times10^5$ ，数字范围 $\leq 10^7$ 。
题解：~~直接模拟题意即可。~~
从小到大处理出所有含有 $7$ 的数，这可以通过一个递推关系来实现：设 $f (n)$ 表示数字 $n$ 中是否含有 $7$ ，则有 $10)\ |\ (n \% 10 == 7)$ 。也就是说把 $n$ 拆成个位和前面若干位来考虑即可。
然后从小到大枚举每个含有 $7$ 的数并枚举它的倍数，把枚举到的数标记为不合法即可。作为优化，对于一个本身含有 $7$ ，但其某个因子中也含有 $7$ 的数，可以跳过对于它的倍数的枚举。
这有点类似于埃氏筛的思想，不过含有 $7$ 的数的密度并没有质数那样好的 $\log n)$ 的性质，但无论如何复杂度也是不超过 $\log n)$ 级别，加上常数优秀，实测只需要大约 $1.6 \times 10^7$ 次筛即可。
最后处理询问时，可以直接记录每个数的下一个合法的数是多少，从大到小扫一遍所有的数即可。查询是单次 $O (1)$ 的。
一个小细节： $n = 9999998$ 时的答案为 $10000001$ ，所以刚好筛到 $10^7$ 是不行的。

T2：给定数组 $v$ ，下标从 $0$ 到 $m$ 。对于一个大小为 $n$ ，元素为 $0\thicksim m$ 的数组 $a$ 来说，它的价值是 $\prod_{i=1}^{n} v_{a_i}$ 。再设一个参数 $x=\sum_{i=1}^{n} 2^{a_i}$ ，只有当 $x$ 的二进制中 $1$ 的个数不超过 $k$ 时，才认为这个数组 $a$ 是合法的。给定 $n, m, k$ 和数组 $v$ ，求所有合法的 $a$ 数组的价值之和。
题解：考虑从小到大填所有的数，因为这样一来每填完一种数之后，都可以把 $x$ 对应位的值算出来，可能产生的进位只会影响到高位。
设 $f [i] [j] [l] [p]$ 表示当前要填数字 $i$ ，之前已经填了 $j$ 个数，目前生成的 $x$ 的 $0\thicksim i-1$ 位中已有 $l$ 个 $1$ ，且低位向第 $i$ 位进位的数量为 $p$ 。
初值为 $f [0] [0] [0] [0] = 1$ ，转移时枚举第 $i$ 位填多少个 $1$ （设为 $q$ 个），乘一个转移系数 $\times v_i^q$ ，转移到 $\% 2][(p + q) / 2]$ 。其中 $c [n - j] [q]$ 为组合数。
也就是说，枚举有 $q$ 个位置填 $i$ 之后，从目前为空的 $n - j$ 个位置中选出 $q$ 个的方案数是 $c [n - j] [q]$ ，根据题意这 $q$ 个 $i$ 产生的价值贡献是 $v_i^q$ ；填完这 $q$ 个 $i$ 后，加上之前的进位， $x$ 的第 $i$ 位现在有 $p + q$ 个 $1$ ，最后这一位是否为 $1$ 就取决于 $(p+q)\%2$ 的值，同时要向高一位产生 $(p + q) / 2$ 个进位。
最后的dp状态是 $f [m + 1] [n] [l] [p]$ ，其中 $l$ 从 $0$ 枚举至 $k$ ， $p$ 从 $0$ 枚举至 $n$ 。别忘了 $l$ 只是代表前 $\thicksim m$ 位的 $1$ 的个数，还要加上数字 $p$ 本身的 $1$ 的个数才是真正的 $x$ 中的 $1$ 的个数。设 $p o p c n t (p)$ 为 $p$ 的二进制中 $1$ 的个数，最后将所有满足 $\leq k$ 的dp值 $f [m + 1] [n] [l] [p]$ 求和即可。
状态数 $O(n^3m)$ ，转移 $O (n)$ ，总复杂度 $O(n^4m)$ 。

T3：给定序列 $a$ ，保证序列单调不降，每次可以选择一个下标 $i(1\lt i \lt n)$ ，将 $a_i$ 变成 $a_{i-1} + a_{i+1} - a_i$ 。问若干次操作之后整个序列的方差最小是多少。
题解：考虑这个操作的本质。由于序列不降，可以考虑差分。
设相邻三个数分别为 $a, a + b, a + b + c$ ，差分后为 $b, c$ ，对中间的数操作之后就变成 $a + (a + b + c) - (a + b) = a + c$ ，换句话说序列变成 $a, a + c, a + b + c$ ，差分后为 $c, b$ 。也就是说操作的本质就是交换相邻两个差分值。
又由于对序列整体加一个值之后方差不变，因此我们直接看这些差分值即可。
由于要使得方差尽可能小，我们当然希望中间的数尽可能密一些。而相邻两个数的差的种类和数量已经固定了，唯一能变的就是安排顺序的问题了，我们自然会想让比较小的那些差值尽可能往中间放，也就是说差分数组很有可能呈现中间小两边大的性质。实际上我们可以严格证明：最优方案中差分数组一定是单谷的，也就是说先递减后递增。
~~由于空间有限这里就不证了。~~
此时我们可以这样玩：强行钦定差分数组中最小的那个数对应差分前为 $0$ ，然后从小到大枚举差分数组，每次可以选择将这个差分值放在当前的最左边或是最右边。在左边和右边各记录一个差分值的和 $s_l,s_r$ ，则来了一个差分值 $b_i$ 之后，如果放在右边，就意味着 $a$ 数组中多了一个数 $s_r+b_i$ ，同时 $s_r += b_i$ ；放在左边同理。
这样我们已经能设计一个 $O(2^n)$ 的暴力了，下一步就是把它改成dp。
设 $f [l] [r] [s]$ 表示目前的 $s_l=l,s_r=r$ ，所有已有的 $a_i$ 和为 $s$ 的答案。注意这里我们可以采用方差的另一种计算方式： $D=(\sum_{i=1}^n a_i^2)/n - (a')^2$ ，其中的 $a^{'}$ 为平均值。这样dp状态里只需要存最小的 $\sum a_i^2$ 即可。另外，对于给定的 $l$ 和 $r$ ，我们其实能唯一算出来目前放到第几个数了，因此不需要额外记录一维。
注意到差分值中所有的 $0$ 我们都是可以不管的，而非 $0$ 的差分值之和不超过 $m=\max\{a_i\}$ 且都是正的，因此数量也不超过 $m$ 。因此数据范围里给的诸如 $n = 10000$ 之类的完全是唬人，由于 $s$ 最大是 $O(m^2)$ ，上述dp的总复杂度为 $O(m^4)$ 。
这还差一点，不过我们还有接下来的奇妙处理（warning：以下做法非官方题解，官方做法是严格 $O(nm^2)$ 复杂度的，以下只是我和出题人放飞自我的脑洞）：
想象一下 $s$ 在累加的过程中有正有负，最终的最优答案不太可能偏离 $0$ 太远。因此我们可以人为给 $s$ 设定一个小于 $m^2$ 的上界，比如常数倍的 $m$ 之类的。实际上，我证明了在最优答案中 $s$ 不会超过 $O(m^{1.5})$ ，而且这个上界非常松，极有可能实际上最多是 $O (m)$ 的。
那问题来了：我不知道这个界设定到多少才合适，万一开小了wa，开大了T咋办？还有一种玄学做法如下：
从小到大枚举最后的和 $s$ （显然正负的情况是对称的，因此从 $0$ 开始往上枚举即可）。然后在dp时不再记录 $s$ 这一维，计算方差的方式也变回 $(\sum (a_i - a')^2) / n$ ，dp数组里存当前最小的 $\sum (na_i-s)^2$ 。
你可能发现了问题：万一这个 $s$ 不是最后这些 $a_i$ 真正的和，这么算出来的方差不就错了吗？神奇之处就在这儿了：如果我们把方差看作一个“关于平均值的函数”，也就是在已知 $a_1,...,a_n$ 的情况下，定义函数 $f(x)=(\sum_{i=1}^n (a_i-x)^2)/n$ ，则得到一个关于 $x$ 的二次函数，而不难验证它在 $x$ 恰好等于这些 $a_i$ 的平均值时取最小值，最小值就是这些 $a_i$ 的方差。因此，错误的平均值只会让算出来的“方差”更大，因此把所有枚举的 $s$ 都跑一遍之后，胜出的就一定是最优解中“正确”的 $s$ 对应的答案了。
这样的好处在于，我们可以从小到大枚举 $s$ 之后加上卡时，这样就不用担心上界开得不合理的问题了。经与出题人沟通，这样的做法根本卡不掉。
~~什么叫乱搞党的胜利啊（战术后仰）~~

T4：给定 $n * m$ 的棋盘，棋盘上有 $4$ 种类型的边，分别代表不可通行、只能走一步、只能一直沿一个方向往前走和可以任意走。棋子有两种颜色和等级，棋子间可以吃子，规定只能吃颜色不同且等级不高于自己的棋子，且吃完子后不能继续向前走。同时规定每次走子时经过的边类型必须相同。初始棋盘是空的，有 $q$ 次操作，每次往棋盘上放一个棋子，问这个棋子能走到多少个格子。
题解：先在不考虑吃子的情况下看一个棋子能走到哪些空格子。此时可以把之前已经放上的棋子当作障碍，那么对于第一类边，只需要考虑上下左右 $4$ 个格子；对于第二类边，只需要考虑沿着上下左右 $4$ 个方向延伸出去的一条线段；对于第三类边，只需要考虑第三类边形成的连通块。
我们发现放一个棋子相当于删掉图中的一个点，删点维护图的连通性这件事太蛋疼了，于是我们不妨把问题反过来：假设一开始所有的棋子都是在棋盘上的，我们要每次删去一个棋子，删之前问它能走到多少个格子。
显然加点维护连通性是相对容易的，在不需要维护特殊信息的情况下只需要并查集就能搞定；即使需要维护集合，我们也有启发式合并、线段树合并等一堆合并集合的数据结构和算法。这为我们进一步分析题目提供了很好的技术支持。
首先，对于一类边，只有有限个点的情况总是好处理的：在别的情况都处理完之后，只需要暴力查询一下这几个点是否能被以其他方式走到即可。用并查集自然就可以做到。
对于二类边，我们可以在每个点上维护它向 $4$ 个方向最远能沿着二类边走到哪。这件事也可以用并查集来维护，就是连续一段横向或纵向的二类边串起来的点分别用并查集维护起来，并查集中再顺手维护一个集合的编号最小/最大的点总是容易的。
对于三类边，我们好像也可以直接拿并查集维护所有点在三类边下的连通性，维护每个连通块的大小即可。
做完了吗？没有，最麻烦之处在于：如果一个点通过二类边和三类边都能走到，怎么去重？
此时要注意到一个性质：我们可以让二类边串起来的一排点的编号是连续的。如果我们把点按照横坐标第一关键字、纵坐标第二关键字排序的话，那么横向的二类边连通块对应编号连续的集合；反之，如果纵坐标第一关键字、横坐标第二关键字，编号连续的就是纵向的二类边连通块了。
所以，如果我们能在一个三类边连通块里查询编号位于某个区间内的点的数量，就可以实现去重了。
回过头来，我们发现简单地用并查集维护三类边的连通块似乎是行不通的，因为去重操作意味着我们还需要实打实地把每个连通块中的点记录下来。这就要用到我们先前提到的集合合并了：我们对每个三类边连通块开两个集合，分别存储其中的点按照两种编号方式的编号。合并连通块时，将两个集合对应合并，查询时在集合中区间查询即可。这里推荐使用线段树合并，因为复杂度为 $1$ 个 $\log$ 且线段树天生支持区间查询。
最后还要处理吃子的情况。我们发现能通过一、二类边吃到的子每个方向上最多一个，因此也留到最后暴力处理即可；而通过三类边能吃到的子可能很多，在当前这个三类边连通块里，如果某个点又向外连了一条三类边而且恰好遇到了一个棋子，它就要被纳入考虑。
具体而言，我们要在每个三类边连通块上同时绑定与其直接通过三类边相邻的棋子集合，当然肯定要分黑白两色维护；合并连通块时，需要把两个集合分别合并，同时注意一个棋子可能同时在两个三类边连通块的集合中，因此还要去重（这里推荐先离散化使得每个棋子的等级均不同，以便于去重）。查询时，只需查询与当前棋子颜色相反的集合中，等级不超过它自身的棋子有多少个即可，这相当于一个前缀查询操作。显然这也是线段树合并就能解决的任务。对于一、二类边的特判，只需将涉及到的棋子在线段树中查询一下是否存在即可。
总结：倒序操作+合并连通块+维护集合，支持合并、区间查询+线段树合并，总复杂度 $\log (nm+q))$ 。
std码长大约 $6 K B$ 多的样子，能在场上写出来调过的人请深受我一拜orz。实际上，如果不去写正解的话，至少前 $32$ 分是可以直接模拟+bfs简单通过的，中间“没有三类边”的部分可以如上述题解所述用并查集维护二类边连通块，最后 $n,m\leq 1000,q\leq 2000$ 的部分只需要用并查集维护三类边连通块的大小，而一、二类边以及可能的吃子均不超过 $O (n + m + q)$ 级别，可以枚举+暴力判断，复杂度 $O (n m + q (n + m + q))$ （不过据我所知场上真正写了这档的人好像很少的样子qwq）。如上至少 $56$ 分是可以不用写大数据结构即可实现的。~~有人说T4部分分是乱给的，他可不是乱给的啊~~

全场总结：个人感觉整体难度相比NOIP2020和CSP-S2021来说均略有下降，而且难度分布更合理了，既有T1这种小清新送分，也有T2这种仔细想想能做出来的dp和T3这种乱搞思维题，最后T4的数据结构当然也是常规~~防AK，而且好像也没防住~~操作了。唯一的不足可能是数学相关的稍微多了点？以及T4码量太大确实没啥办法，不过看在压轴题的份上也就……还好吧。
~~一不小心写了5000多字，好家伙我平时写论文的时候怎么没见这么个积极性呢qwq~~