洛谷 3370 字符串hash模板题

最新推荐文章于 2022-07-24 22:32:30 发布

沙雕.

最新推荐文章于 2022-07-24 22:32:30 发布

阅读量233

点赞数

分类专栏：字符串

本文链接：https://blog.csdn.net/weixin_43768644/article/details/89478660

版权

字符串专栏收录该内容

64 篇文章 1 订阅

订阅专栏

题目链接：https://www.luogu.org/problemnew/show/P3370

解题思路：

①set 也直接过了

while (cin>>n){
    set<string>s;
    string str;
    while (n--) cin>>str,s.insert(str);
    cout << s.size() <<endl;
}

②字符串哈希，最基础的应用是将不同字符串转为独一无二的一个数字。

emm，10进制数相同当且仅当所有位上数字都相同。

同样的道理，现在有n种字符，每种字符当成一个数，当这个数×当前所在的位的倍数是唯一一个数时，那么可以保证这个数位上的这个数是独一无二的。

会有两个问题：

①：假如一个字符串中有a~z这26个字母，ACSII 码97~122，那么这个倍数设置为27会不会出现字母不同的两个字符串代表的数字相同?

简单的想想，一个高位大的字符串和一个高位小的但是低位大的数应该是有可能相等的吧。（并不会证明）

那么怎么样必不可能出错呢？倍数设置为123或者更大， 123进制能保证 a00000000 > 0zzzzzzz

总结：不想出错，最好将倍数设置的比最大ASCII 码大

②：数字很大，所以要取模，取模导致不同的数相同。但是只要这个模够大，“倒霉”的几率比较小，推荐使用unsigned long long（无符号长整型）保存数据，unsigned类型自动取模，且对2^64-1自动取模。

代码：（代码里转化数字不是字符*当前倍数这样的，用的是秦九韶公式）

#include<iostream>
#include<set>
#include<string>
#include<algorithm>
#define ull unsigned long long
using namespace std;

const int N = 1e4+5;

ull Hash[N];

int main()
{
    std::ios::sync_with_stdio(false);
    int n;
    string s;
    while (cin>>n){
        for (int i=0;i<n;i++){
            ull cnt = 0;
            ull p = 256;
            cin>>s;
            for (int j=0;j<s.size();j++) cnt = cnt*p + s[j];
            Hash[i] = cnt;
        }
        sort(Hash,Hash+n);
        cout << unique(Hash,Hash+n) - Hash << endl;
    }
    return 0;
}

4.22-4.28 :字符串处理等级2