何为二分?
确定一个区间,使得目标值一定在区间中
找一个性质,满足:
1.性质具有二段性
2.答案是二段性的分界点
例题1:我在哪?
农夫约翰出门沿着马路散步,但是他现在发现自己可能迷路了!
沿路有一排共 N 个农场。
不幸的是农场并没有编号,这使得约翰难以分辨他在这条路上所处的位置。
然而,每个农场都沿路设有一个彩色的邮箱,所以约翰希望能够通过查看最近的几个邮箱的颜色来唯一确定他所在的位置。
每个邮箱的颜色用 A…Z 之间的一个字母来指定,所以沿着道路的 N 个邮箱的序列可以用一个长为 N 的由字母 A…Z 组成的字符串来表示。
某些邮箱可能会有相同的颜色。
约翰想要知道最小的 K 的值,使得他查看任意连续 K 个邮箱序列,他都可以唯一确定这一序列在道路上的位置。
例如,假设沿路的邮箱序列为 ABCDABC
。
约翰不能令 K=3,因为如果他看到了 ABC
,则沿路有两个这一连续颜色序列可能所在的位置。
最小可行的 K 的值为 K=4,因为如果他查看任意连续 4 个邮箱,那么可得到的连续颜色序列可以唯一确定他在道路上的位置。
输入格式
输入的第一行包含 N,第二行包含一个由 N 个字符组成的字符串,每个字符均在 A…Z 之内。
输出格式
输出一行,包含一个整数,为可以解决农夫约翰的问题的最小 K 值。
数据范围
1≤N≤100
输入样例:
7
ABCDABC
输出样例:
4
解题思路:本题的意思就是找到一个最小的长度k,使得整个字符串中任何两个长度为k的子串都不相同。
暴力解法:
从小到大枚举长度k,同时去枚举第一个区间的起点i,枚举第二个区间的起点j,在循环中比较两个区间是否存在相同的字符,
如果不存在,得到的k即为最小值。
二分优化:
因为k是有序的,且具有二段性,如果当前的k是满足题目要求的,即对于整个字符串,任意两个长度为k的子串都不相同,
那么大于k这个长度的子串必然满足条件,小于k这个长度的子串可能会满足条件,所以可以去二分。
对于二分的长度k,我们去枚举该长度的每一个字串,将枚举到的字串加入到哈希表中,哈希表中如果存在,
即判断有相同,不存在则满足条件
#include <iostream>
#include <unordered_set>
using namespace std;
int n;
string str;
bool check(int k)
{
unordered_set<string> h;
for (int i = 0; i + k - 1 < n; i ++)
{
string s = str.substr(i, k);
if (h.count(s)) return false;
h.insert(s);
}
return true;
}
int main()
{
cin >> n >> str;
int l = 1, r = n;
while (l < r)
{
int mid = l + r >> 1;
if (check(mid)) r = mid;
else l = mid + 1;
}
cout << l << endl;
return 0;
}