(UESTC - 1092)韩爷的梦(哈希 去重)

一天,韩爷去百度面试,面试官给了他这么一个问题。

给你2万个字符串,每个字符串长度都是100,然后把2万个字符串丢入一个 set< string >g 中,问最终set里含有多少个元素?

g 是一个用来存储字符串、具有去重功能的容器,即相同字符串在 g 中只能保留一个。

两个字符串相等,当且仅当,长度一样且对应位置的字符都一样。

韩爷前晚没睡好,随手写了一个程序交给面试官,然后就gg了。

#include<iostream>
#include<string>
#include<set>
using namespace std;
string s;
set<string>g;
int main(){
    for(int k=1;k<=20000;k++){
        cin>>s;
        g.insert(s);
    }
    cout<<g.size()<<endl;
    return 0;
}

韩爷醒来之后,发现这只是一个梦(还好只是个梦)。他回忆起梦中的面试官给他的内存限制和时间限制非常低,这么做肯定过不了,那么,现在你不在梦中,你能解决这个问题么?

Input
单case

每个case有且只有2万行,每一行包含一个字符串,每行字符串的长度都为100 (样例除外)

字符集:大写英文字母(A-Z),小写英文字母(a-z),数字(0-9)

Output
输出一个整数,表示最终set里含有多少个元素。

Sample Input
aaAa
aaAa
bbbb
1234
bbbb
bbbb
ee09
Sample Output
4
Hint
样例只是样例,不在test中

注意时间限制和内存限制非常低

分析:就是求集合的大小,关键在于时间和内存, 这里就用哈希表和unique()函数解决

#include <cstdio>
#include <cstring>
#include <iostream>
#include <cmath>
#include <algorithm>
#include <sstream>
#include <string>
#include <set>
#include <map>
#include <queue>
using namespace std;
#define mem(a,n) memset(a,n,sizeof(a))
#define pb(x) push_back(x)
typedef long long LL;
typedef unsigned long long ull;
const int mod=1e9+7;
const double eps=1e-6;
const int INF=0x3f3f3f3f;
const int N=2e4+5;
LL vis[N];
LL has(char *s)
{
    int len=strlen(s);
    LL ans=0;
    for(int i=0;i<len;i++)
        ans=(ans*10000+s[i])%mod;///注意这里的10000必须足够大,否则可能WA
    return ans;
}
char str[105];
int cnt=0;
int main()
{
    while(~scanf("%s",str))
        vis[cnt++]=has(str);
    sort(vis,vis+cnt);
    LL ans=unique(vis,vis+cnt)-vis;
    printf("%lld\n",ans);
    return 0;
}
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值