字符串(一)、字符串Hash

今天开一手最不(tao)擅(yan)长的字符串算法:字符串Hash算法。

似乎提到字符串的话,KMP应该是更为常见的一种,但是hash有它的优点,被犇们称为“优雅的暴力”。

何谓hash?hash的中文称为哈希,这当然是音译,直译过来就是散列,或者也有叫预映射的。哈希的作用就是通过某个特殊函数的映射,将任意长度的输入映射为固定长度的输出。而字符串哈希涅,顾名思义当然就是把字符串转换为整数的函数。但是有些时候,这些映射无法做到一一对应,我们称之为碰撞/冲突,这时候就需要某些手段避免这些碰撞。

字符串hash的主要算法就是“BKDR Hash”,其采用了进制压缩的思想,把字符串中的每个字符看成一个大数每一位上的数字,然后对这个结果取模,我们认为取模后的结果和原来的结果是等价的,这样就可以在有一定的错误率的基础上进行判断了。当然也可以写成unsigned long long,自动对超过范围的数取模2^64。哈希的精度不够的话,还可以使用双哈希。


字符串哈希的思想非常简单,实现起来也很方便。在某些特定的情况下,例如判定字符串的重复性的时候,使用字符串hash会显得非常高效。

#include<bits/stdc++.h>
#define INF 0x7ffffff
using namespace std;

char s[1007];

typedef unsigned long long ull;
ull a[20003];
ull base=233;


ull Hash(){
    int len=strlen(s);
    ull ans=0;
    for(int i=0;i<len;i++)
        ans=ans*base+s[i];
    return ans&INF;
}

int main(){
    int n;
    cin>>n;
    for(int i=0;i<n;i++){
        cin>>s;
        a[i]=Hash();
    }
    sort(a,a+n);
    int ans=1;
    for(int i=1;i<n;i++)
        if(a[i]!=a[i-1]) ans++;
    cout<<ans<<endl;


    return 0;
}

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值