2017图灵杯问题J 简单的变位词(哈希算法)

题目描述

变位词是指改变某个词的字母顺序后构成的新词。蔡老板最近沉迷研究变位词并给你扔了一道题:

给你一些单词,让你把里面的变位词分组找出来。互为变位词的归为一组,最后输出含有变位词最多的前五组。如果有组数相同的按照字典序输出。

输入

 输入包含由小写字母组成的单词,用换行分割,被EOF终止。 输入数据不超过30000个单词。

输出

 输出五组包含单词数量最多的变位词,如果少于五组,输出全部。对每组输出,写出它的大小和成员词,成员词按字典序排序用空格分隔,每组输出之间用换行分隔,相同词只输出一次,但算个数。

样例输入

neuq
tea
bate
beat
caret
trace
nueq
carte
cater
crate
abet
ate
eat
beta
eta
signal

样例输出

Group of size 5: caret carte cater crate trace .
Group of size 4: abet bate beat beta .
Group of size 4: ate eat eta tea .
Group of size 2: neuq nueq .
Group of size 1: signal .

思路:首先判断单词集合是否相等,26个字母的哈希即可(小范围),故不需要用rand()函数即可解决;然后按哈希值排序确定每组的个数同时确定一组中字典序最小的字符串(确定最小便于以后每组的个数有相同时,按字典序进行比较);最后根据个数同时针对字符串对组升序排序输出即可;


代码:

#include<cstdio>
#include<cstring>
#include<vector>
#include<map>
#include<algorithm>
using namespace std;

const int maxn=30005;
const int maxm=30;
const int X=30;
typedef unsigned long long ll;
typedef pair<ll,int> pii;

int N,M,E;
vector<pii> vec,grop;
vector<int> g[maxn];
char word[maxn][maxm],st[maxn][maxm];

inline ll Hash(char* s){
    int len=strlen(s),c[maxm];
    memset(c,0,sizeof(c));
    for(int i=0;i<len;i++)
        c[s[i]-'a']++;
    ll ret=0;
    for(int i=0;i<26;i++)
        ret=ret*X+c[i];
    return ret;
	}

inline bool cmp (const pii& a,const pii& b){
    if(a.second==b.second)
        return strcmp(st[a.first],st[b.first])<0;//按最小字符串排; 
    return a.second>b.second;//优先个数排; 
	}

inline bool sort_by(const int& a,const int& b){
    return strcmp(word[a],word[b])<0;
	}

int main()
{
    N=M=E=0;
    vec.clear();
    grop.clear();
    while(scanf("%s",word[N])==1){
        ll key=Hash(word[N]);
        vec.push_back(make_pair(key,N));
        N++;
		}
    sort(vec.begin(),vec.end());//哈希值排序; 
    int cnt=0;
    ll pre=-1;
    for(int i=0;i<vec.size();i++){
        int idx=vec[i].second;
        if(vec[i].first!=pre){
            if(cnt)
                grop.push_back(make_pair(M++,cnt));//M代表第几组,cnt代表这组个数; 
            cnt=0;
            g[M].clear();
            pre=vec[i].first;
            strcpy(st[M],word[idx]);
		}
        cnt++;
        g[M].push_back(idx);//将字符串第idx个进第M组; 
        if (strcmp(word[idx],st[M])<0)
            strcpy(st[M],word[idx]);//确定一组中字典序最小的字符串; 
	}
    if (cnt)//考虑最后几个重复情况; 
        grop.push_back(make_pair(M++,cnt));
    sort(grop.begin(),grop.end(),cmp);//按优先second排序,后字典序排序; 

    for(int i=0;i<min(5,(int)grop.size());i++){
        printf("Group of size %d: ",grop[i].second);
        int x=grop[i].first;
        sort(g[x].begin(),g[x].end(),sort_by);//每组排序; 
        for (int j=0;j<g[x].size();j++){
            if (j==0||strcmp(word[g[x][j-1]],word[g[x][j]]))
                printf("%s ",word[g[x][j]]);
			}
        printf(".\n");
		}
    return 0;
}


评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值