题目大意:给出一个字典,找出所有复合词,即该单词由字典里的两个单词连接而成。
分析:字符串hash。首先,将字符串压缩成一个整数,这个整数我们就称之为hash。当然,不可能每一个字符串都对应一个不同的整数,所以,我们用类似邻接表的方法做出一个哈希表。然后,又每个单词可以拆分成两个单词,我们就可以通过hash值,在几乎常数的时间内判断单词是否在字典里。
代码:
#include <cstdio>
#include <iostream>
#include <string>
#include <cstring>
#include <algorithm>
using namespace std;
const int maxn =1000003;
int head[maxn], next[maxn]; //数组形式的hash表
string s[maxn];
int cnt;
void init() {
for(int i = 0; i < maxn; i++)
head[i] = next[i] = -1;
cnt = 0;
}
int gethash(string str) {
int sum = 0;
int len = str.length();
for(int i = 0; i < len; i++)
sum = (sum << 5) + str[i];
return (sum&0x7fffffff) % maxn;
}
void add(string str) {
int c = gethash(str);
s[cnt] = str;
next[cnt] = head[c];
head[c] = cnt++;
}
bool exist(string str) {
int c= gethash(str);
for(int i = head[c]; i != -1; i = next[i])
if(s[i] == str) return true;
return false;
}
int main() {
string str;
init();
while(cin >> str) add(str);
for(int i = 0; i <cnt; i++) {
int len = s[i].length();
for(int j = 1; j < len; j++) {
string s1 = s[i].substr(0, j);
string s2 = s[i].substr(j, len-j);
if(exist(s1) && exist(s2)) {
cout << s[i] << endl;
break;
}
}
}
return 0;
}