题目为:
给定一个整数n,计算,其中
为i的最低位1所在的位置(注意和常规的lowbit定义不同),例如
,因为
。
输入格式:
第一行一个数 T 表示 T 组测试数据。
接下来有 T 行,每行一个 n 。
(1≤T≤100000,1≤n≤)
输出格式:
输出 T 行,每行一个数,第 i 行的数表示第 i 组测试的答案,由于答案可能很大,请将答案对 取模。
输入样例:
5
1
2
3
4
5
输出样例:
1
5
8
20
25
分析:
在一般的解题过程,比如比赛或日常训练赛中,这种题型大概率是先枚举找规律。但是作者把这道题划分在数论范围内,让我得以思考,为什么作者要塞进数论中。
事实上,如果按照一般找规律的思路,我们没有必要非常深入地去分析规律是什么,我们只需要找到部分规律以至于可以把题在有限时间和空间条件下解出即可。
同时事实上,这个确实有一个类似数论的性质,但既不是模性质也不是什么整数定理,而是二进制模式本身具备的性质。我单纯着重分析这部分的内容。
注意到,,而且
序列服从
其中
表示数组连接符,这个关系的意思是lowbit序列的前2n项为lowbit的前n项复制n-1项到后面,并再添加一个
元素到最末尾。前面一个性质只是也许会体现出可以将n进行二进制展开而利用的结果,而后面一个性质则揭示可以进行二进制展开的属性。
但真正要表现这个属性的前提需要进行求和,但是求和对于原式有什么作用呢?这里不妨先对所需计算求和表达式进行一种整理,这种整理的技术叫做Abel变换(错位相减的扩展版本):
其中,,
,小写改大写一般表示序列的前n项和,而三角表示差分符。这个公式是Abel变换的特殊形式,而更复杂的形式或者一般形式不打算展开,因为可以通过该结论做差完成。
注意,和计算机的顺序不一样的是,该公式针对于数列(即高中所学过的从1开始的序列)
有了该公式后,先分析题目,可以得到:
这意味着需要先计算。
这里就可以考虑利用的性质,假设需要求
(这个表示整个序列的和),那么实际上就是在求
可以考虑补充一个数以至于有
注意到这里可以化解到这么简单的形式。
这就意味着了。
而对于
这个表达式的构造非常重要,因为在不满足项的lowbit序列中,其中大于
的部分项都是前面的复制!这意味着对其求和等于两部分的和,而一部分的和是一个子问题!即:
(
,也意味着sum[lowbit{0}]=0)
这个性质十分重要,进一步揭示lowbit这种形式可以考虑直接对n进行二进制展开再计算,而每个计算的主要部分都只是,意味着对其求和的原
计算化为
的计算量
这个性质我简单阐述为二进制分解定理。这个定理的需求就是存在这种复制性的条件,其实后面还可以看见不只是简单的复制,有规律的变换都可以利用变换的规律把
计算化为
的计算量。
然后观察n二进制展开并于位对应的相加就有
即任何的前n项lowbit相加只为两倍n减去n中二进制为1的个数,这是由于以及
个数等于二进制为1的个数。
所以又有
可进一步化成
而观察的性质,它也有类似的二进制分解性:
注意,每个花括号的表示前N项的项数,而对其运算则表示全部的元素都进行一个这样的运算,比如这里加1是表示所有项都加1。
这里不同于lowbit的是,这里不是直接复制,是之前的元素经过一个同样规则的运算之后再得到的。
考虑求和:
补项有:
这由于有的项,无法很简单地计算出该结果,但是可以通过动态规划的思路,直接计算并储存!
unsigned long long _scb2k[65] = {1, 2};
void scb2k_init() {
for (int i = 1; i < 64; ++i) {
_scb2k[i + 1] = ((_scb2k[i] << 1) + (1ull << i) - 1) % mod;
}
}
根据二进制分解定理,当具备这种分解性时,只需要用二进制展开取位置为1的项就可以用于计算:
这是由于大于,且小于
的项为前面的值加一。故剩余量a是指剩余长度,而加一的量就是指相应的长度量。
因此,的代码就可以表示为:(数学结果和计算机有位差,会有
的情况,很正常)
unsigned long long scb(unsigned long long n) {
unsigned long long pow_iter = 0x8000000000000000ull;
int pow_index = 64;
unsigned long long ret = 0;
while (pow_index > 0) {
if (n & pow_iter) {
ret += (_scb2k[pow_index - 1] + (n -= pow_iter)) % mod;
}
if (!n) break;
pow_iter >>= 1;
--pow_index;
}
return ret;
}
其实还可以顺着从最小位开始,具体代码请读者自行操作了。
而注意到,最终的计算结果还差一个关于countbits的计算,这里用一个非常著名的的算法:
int count_bits(unsigned long long x) {
x = (x & 0x5555555555555555ull) +
((x & 0xaaaaaaaaaaaaaaaaull) >> 1);
x = (x & 0x3333333333333333ull) +
((x & 0xccccccccccccccccull) >> 2);
x = (x & 0x0f0f0f0f0f0f0f0full) +
((x & 0xf0f0f0f0f0f0f0f0ull) >> 4);
x = (x & 0x00ff00ff00ff00ffull) +
((x & 0xff00ff00ff00ff00ull) >> 8);
x = (x & 0x0000ffff0000ffffull) +
((x & 0xffff0000ffff0000ull) >> 16);
x = (x & 0x00000000ffffffffull) +
((x & 0xffffffff00000000ull) >> 32);
return x;
}
因此最终的计算结果就可以表示为:整个计算过程只有的复杂度,会比for历遍好不少。这都是由于lowbit及其和的具备的二进制分解性的功劳。
unsigned long long func(unsigned long long n) {
__uint128_t k = n;
return ((k + 1) * (k - count_bits(n)) + scb(n)) % mod;
}
用128位是为了不想写一堆容易错的内部mod,这只是从理论上进行一定程度的优化,虽然说是为了解这道题,但是主要是分析出一种二进制分解性的东西,具体可能有很多方面的应用,这道题本身可能还有更微妙的计算方法,具体不做展开。