题目链接:https://www.luogu.org/problemnew/show/P3370
解题思路:
①set 也直接过了
while (cin>>n){
set<string>s;
string str;
while (n--) cin>>str,s.insert(str);
cout << s.size() <<endl;
}
②字符串哈希,最基础的应用是将不同字符串转为独一无二的一个数字。
emm,10进制数相同当且仅当所有位上数字都相同。
同样的道理,现在有n种字符,每种字符当成一个数,当这个数×当前所在的位的倍数 是 唯一 一个数时,那么可以保证这个数位上的这个数是独一无二的。
会有两个问题:
①:假如一个字符串中有a~z这26个字母,ACSII 码97~122,那么这个倍数设置为27会不会出现字母不同的两个字符串代表的数字相同?
简单的想想,一个高位大的字符串 和 一个高位小的但是低位大的数应该是有可能相等的吧。(并不会证明)
那么怎么样必不可能出错呢?倍数设置为123或者更大, 123进制能保证 a00000000 > 0zzzzzzz
总结:不想出错,最好将倍数设置的比最大ASCII 码大
②:数字很大,所以要取模,取模导致不同的数相同。但是只要这个模够大,“倒霉”的几率比较小,推荐使用unsigned long long(无符号长整型)保存数据,unsigned类型自动取模,且对2^64-1自动取模。
代码:(代码里转化数字不是 字符*当前倍数这样的,用的是秦九韶公式)
#include<iostream>
#include<set>
#include<string>
#include<algorithm>
#define ull unsigned long long
using namespace std;
const int N = 1e4+5;
ull Hash[N];
int main()
{
std::ios::sync_with_stdio(false);
int n;
string s;
while (cin>>n){
for (int i=0;i<n;i++){
ull cnt = 0;
ull p = 256;
cin>>s;
for (int j=0;j<s.size();j++) cnt = cnt*p + s[j];
Hash[i] = cnt;
}
sort(Hash,Hash+n);
cout << unique(Hash,Hash+n) - Hash << endl;
}
return 0;
}
4.22-4.28 :字符串处理 等级2