题目链接
P2078 - [蓝桥杯2023初赛] 01 串的熵 - New Online Judge
题目描述
对于一个长度为 n 的 01 串 S = x1x2x3...xn.
香农信息熵的定义为:
。
其中 p(0), p(1) 表示在这个 01 串中 0 和 1 出现的占比。
比如,对于S = 100 来说,信息熵 H(S ) = - 1/3 log2(1/3) - 2/3 log2(2/3) - 2/3 log2(2/3) = 1.3083。
对于一个长度为23333333 的 01 串,如果其信息熵为 11625907.5798,且 0 出现次数比 1 少,那么这个01 串中 0 出现了多少次?
本题的结果为一个整数,在提交答案时只输出这个整数,输出多余的内容将无法得分。
方法一
暴力枚举,23333333的数量级为10^7不大,根据题意暴力枚举很快可以得出答案
#include <iostream>
#include <cmath>
using namespace std;
const int len = 23333333;
const double h = 11625907.5798;
// 暴力枚举
int main()
{
for (int i = 1; i < len / 2; ++i) // 0的个数
{
double x = 0.0;
x -= i * (1.0 * i / len) * log2(1.0 * i / len);
x -= (len - i) * (1.0 * (len - i) / len) * log2(1.0 * (len - i) / len);
if (abs(x - h) < 1e-4) // double有误差
{
cout << i << endl;
return 0;
}
}
return 0;
}
方法二
二分,只有1时H为0,只有0时H也为0,1与0个数相等时H最大,当0比1少时,1与0个数越接近H越大,H单调递增,因此可以采用二分算法减小时间复杂度
代码
#include <iostream>
#include <cmath>
using namespace std;
const int len = 23333333;
const double h = 11625907.5798;
// 二分
int main()
{
int left = 0, right = len / 2;
while (left < right)
{
int mid = left + (right - left) / 2;
double x = 0;
x -= mid * (1.0 * mid / len) * log2(1.0 * mid / len);
x -= (len - mid) * (1.0 * (len - mid) / len) * log2(1.0 * (len - mid) / len);
if (abs(x - h) < 1e-4) // 浮点数大小比较
{
cout << mid << endl;
return 0;
}
else if (x > h)
right = mid;
else
left = mid + 1;
}
return 0;
}