洛谷 3370 字符串hash模板题

题目链接https://www.luogu.org/problemnew/show/P3370

解题思路

①set 也直接过了

while (cin>>n){
    set<string>s;
    string str;
    while (n--) cin>>str,s.insert(str);
    cout << s.size() <<endl;
}

②字符串哈希,最基础的应用是将不同字符串转为独一无二的一个数字。

emm,10进制数相同当且仅当所有位上数字都相同。

同样的道理,现在有n种字符,每种字符当成一个数,当这个数×当前所在的位的倍数 是 唯一 一个数时,那么可以保证这个数位上的这个数是独一无二的。

会有两个问题:

    ①:假如一个字符串中有a~z这26个字母,ACSII 码97~122,那么这个倍数设置为27会不会出现字母不同的两个字符串代表的数字相同?

简单的想想,一个高位大的字符串 和 一个高位小的但是低位大的数应该是有可能相等的吧。(并不会证明)

那么怎么样必不可能出错呢?倍数设置为123或者更大,   123进制能保证   a00000000  >  0zzzzzzz 

总结:不想出错,最好将倍数设置的比最大ASCII 码大

    ②:数字很大,所以要取模,取模导致不同的数相同。但是只要这个模够大,“倒霉”的几率比较小,推荐使用unsigned long long(无符号长整型)保存数据,unsigned类型自动取模,且对2^64-1自动取模。

代码:(代码里转化数字不是  字符*当前倍数这样的,用的是秦九韶公式)

#include<iostream>
#include<set>
#include<string>
#include<algorithm>
#define ull unsigned long long
using namespace std;

const int N = 1e4+5;

ull Hash[N];

int main()
{
    std::ios::sync_with_stdio(false);
    int n;
    string s;
    while (cin>>n){
        for (int i=0;i<n;i++){
            ull cnt = 0;
            ull p = 256;
            cin>>s;
            for (int j=0;j<s.size();j++) cnt = cnt*p + s[j];
            Hash[i] = cnt;
        }
        sort(Hash,Hash+n);
        cout << unique(Hash,Hash+n) - Hash << endl;
    }
    return 0;
}


4.22-4.28 :字符串处理 等级2

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值