题目描述
现有一种使用英语字母的外星文语言,这门语言的字母顺序与英语顺序不同。
给定一个字符串列表 words ,作为这门语言的词典,words 中的字符串已经 按这门新语言的字母顺序进行了排序 。
请你根据该词典还原出此语言中已知的字母顺序,并 按字母递增顺序 排列。若不存在合法字母顺序,返回 “” 。若存在多种可能的合法字母顺序,返回其中 任意一种 顺序即可。
字符串 s 字典顺序小于 字符串 t 有两种情况:
- 在第一个不同字母处,如果 s 中的字母在这门外星语言的字母顺序中位于 t 中字母之前,那么 s 的字典顺序小于 t 。
- 如果前面 min(s.length, t.length) 字母都相同,那么 s.length < t.length 时,s 的字典顺序也小于 t 。
示例 1:
输入:words = [“wrt”,“wrf”,“er”,“ett”,“rftt”]
输出:“wertf”
示例 2:
输入:words = [“z”,“x”]
输出:“zx”
示例 3:
输入:words = [“z”,“x”,“z”]
输出:“”
解释:不存在合法字母顺序,因此返回 “” 。
提示:
1 <= words.length <= 100
1 <= words[i].length <= 100
words[i] 仅由小写英文字母组成
分析
首先说下题目的漏洞,题目中说“words 中的字符串已经按这门新语言的字母顺序进行了排序 ”,其实后台用例中存在不按照顺序排列的字符串,比如示例2,或许可以认为是z和x的大小关系不明导致它没有按照字母顺序排列,但是题目最后一个后台用例是[“abc”,“ab”],而题目中对字典顺序的定义有“如果前面的字符相同,那么 s.length < t.length 时,s 的字典顺序也小于 t”,显然最后一个用例已经不符合字典序排序规则了,对于这种bug,我们特判下即可,即在两个字符串前面字符相同时,如果长字符排在前面,就直接返回“”。
对于字母的偏序关系,我们可以逐个比较相邻字符串来确定,需要解决的问题是如何维护偏序关系,尤其是维护可传递的偏序关系,比如a < b, b < c,我们最终的答案需要体现a < c,看到题目的第一反应是带扩展域的并查集,然后觉得想复杂了,就是个简单的拓扑排序问题。
对于相邻的两个字符串,比如abc和abd,用两个指针p和q分别指向两个字符串的起点,指向的字符相同,则右移,直到遇见第一个不同字符c和d,就可以判断c < d了,同时从c连一条有向边到d就行了。我们不断的枚举相邻的字符串,给他们的偏序关系建图,最后字符串序列就转化为了一个有向图,只要这个有向图是DAG,就有拓扑序列,输出即可,没有拓扑序列说明有环,返回空字符串。
怎么进行拓扑排序?首先建图的时候如果存在a到b的边,则将b的入度加1,建图完成后遍历所有入度为0的字符,将其放入队列。当队列非空时,取队头元素,将队头元素加入到最后的输出序列中,同时将队头元素指向的字符的入度都减去1,如果有字符的入度变成了0,就加入队列。算法结束后如果还存在入度不为0的点,说明存在环,返回空字符串。
有个细节需要注意下,后台用例还会给出像a,a这样的用例,对于这种用例,我们不知道它和其他节点的偏序关系,但是仍需要输出出现的字符,所以可以先将words里面出现的字符记录下,在统计入度为0的节点入度时,加上这个字符在words中出现过这个条件,就不会漏掉没有偏序关系字符的统计了。
这题官方题解可能想复杂了,所以拓扑排序的解法效率还是可以的。
代码
class Solution {
public:
int idx = 0,e[900],h[30],ne[900];
int ind[30],q[30];
bool st[30];
void add(int a,int b){
e[idx] = b,ne[idx] = h[a],h[a] = idx++;
}
string alienOrder(vector<string>& words) {
int n = words.size();
memset(h,-1,sizeof h);
for(auto s : words){
for(int j = 0;j < s.size();j++) st[s[j] - 'a'] = true;
}
for(int i = 0;i < n - 1;i++){
string l = words[i],r = words[i + 1];
int p = 0,q = 0;
while(p < l.size() && q < r.size() && l[p] == r[p]) {
p++,q++;
}
if(p != l.size()){
if(q == r.size()) return "";//用例出现不合法的字符串序列
add(l[p] - 'a',r[q] - 'a');
ind[r[q]-'a']++;
}
}
string ans = "";
int hh = 0,tt = -1;
for(int i = 0;i < 26;i++) {
if(!ind[i] && st[i]) q[++tt] = i;
}
while(hh <= tt) {
int u = q[hh++];
ans += 'a' + u;
for(int i = h[u];~i;i = ne[i]) {
int j = e[i];
ind[j]--;
if(!ind[j]) q[++tt] = j;
}
}
for(int i = 0;i < 26;i++) {
if(ind[i]) return "";
}
return ans;
}
};