题目
126.单词接龙II
难度:困难
给定两个单词(beginWord 和 endWord)和一个字典 wordList,找出所有从 beginWord 到 endWord 的最短转换序列。转换需遵循如下规则:
1.每次转换只能改变一个字母。
2.转换后得到的单词必须是字典中的单词。
说明:
- 如果不存在这样的转换序列,返回一个空列表。
- 所有单词具有相同的长度。
- 所有单词只由小写字母组成。
- 字典中不存在重复的单词。
- 你可以假设 beginWord 和 endWord 是非空的,且二者不相同。
示例 1:
beginWord = "hit",
endWord = "cog",
wordList = ["hot","dot","dog","lot","log","cog"]
输出:
[
["hit","hot","dot","dog","cog"],
["hit","hot","lot","log","cog"]
]
示例 2:
输入:
beginWord = "hit"
endWord = "cog"
wordList = ["hot","dot","dog","lot","log"]
输出: []
解释: endWord "cog" 不在字典中,所以不存在符合要求的转换序列。
算法
法一:BFS
本题要求的是最短转换序列,看到最短首先想到的就是 BFS。想到 BFS 自然而然的就能想到图,但是本题并没有直截了当的给出图的模型,因此我们需要把它抽象成图的模型。
我们可以把每个单词都抽象为一个点,如果两个单词可以只改变一个字母进行转换,那么说明他们之间有一条双向边。因此我们只需要把满足转换条件的点相连,就形成了一张图。根据示例 1 中的输入,我们可以建出下图:
基于该图,我们以 hit 为图的起点, 以cog 为终点进行广度优先搜索(BFS),寻找 hit 到 cog 的最短路径。下图即为答案中的一条路径。
最大的难点解决了,我们再考虑其他要求。本题要求输出所有的最短路径。那么我们在到达某个点的时候需要把它前面经过的点一起记录下来放到一起,当到达终点的时候一起输出到结果中。
算法实现:
基于上面的思路我们考虑如何编程实现。
方便起见,我们先给每一个单词标号,即给每个单词分配一个 id。创建一个由单词 word到 id 对应的映射 wordId,并将 beginWord 与 wordList 中所有的单词都加入这个映射中。之后我们检查 endWord 是否在该映射内,若不存在,则输入无解。我们可以使用哈希表实现上面的映射关系。
同理我们可以创建一个由对应 id 到 word 的映射 idWord,方便最后输出结果。由于 id 实际上是整数且连续,所以这个映射用数组实现即可。
接下来我们将 idWord 中的单词两两匹配,检查它们是否可以通过改变一个字母进行互相转换。如果可以,则在这两个点之间建一条双向边。
为了保留相同长度的多条路径,我们采用 cost 数组,其中 cost[i] 表示 beginWord 对应的点到第 i 个点的代价(即转换次数)。初始情况下其所有元素初始化为无穷大。
接下来将起点加入队列开始广度优先搜索,队列的每一个节点中保存从起点开始的所有路径。
对于每次取出的节点 now,每个节点都是一个数组,数组中的最后一个元素为当前路径的最后节点 last :
- 若该节点为终点,则将其路径转换为对应的单词存入答案;
- 若该节点不为终点,则遍历和它连通的节点(假设为 to )中满足 cost[to] >= cost[now] + 1cost[to]>=cost[now]+1 的加入队列,并更新 cost[to] = cost[now] + 1cost[to]=cost[now]+1。如果 cost[to] < cost[now] + 1cost[to]<cost[now]+1,说明这个节点已经被访问过,不需要再考虑。
C++代码
const int INF = 1 << 20;
class Solution {
private:
unordered_map<string, int> wordId;
vector<string> idWord;
vector<vector<int>> edges;
public:
vector<vector<string>> findLadders(string beginWord, string endWord, vector<string>& wordList) {
int id = 0;
for (const string& word : wordList) {
if (!wordId.count(word)) {
wordId[word] = id++;
idWord.push_back(word);
}
}
if (!wordId.count(endWord)) {
return {};
}
if (!wordId.count(beginWord)) {
wordId[beginWord] = id++;
idWord.push_back(beginWord);
}
edges.resize(idWord.size());
for (int i = 0; i < idWord.size(); i++) {
for (int j = i + 1; j < idWord.size(); j++) {
if (transformCheck(idWord[i], idWord[j])) {
edges[i].push_back(j);
edges[j].push_back(i);
}
}
}
const int dest = wordId[endWord]; //dest记录endWord对应的序号
vector<vector<string>> res;
queue<vector<int>> q; //队列的每一个节点保存从起点开始的所有路径
vector<int> cost(id, INF);
q.push(vector<int>{wordId[beginWord]}); //将初始化为beginWord的int数组输入队列q
cost[wordId[beginWord]] = 0; //初始化cost
while(!q.empty()){
vector<int> now = q.front();
q.pop();
int last = now.back(); //now数组中的最后一个元素为当前路径的最后节点 last
if(last == dest){ //如果该节点为终点, 则将其路径转换为对应的单词存入答案
vector<string> tmp;
for(int index:now){
tmp.push_back(idWord[index]);
}
res.push_back(tmp);
}else{ //如果不为终点, 则遍历和它连通的节点,
for(int i = 0;i < edges[last].size();++i){
int to = edges[last][i];
if(cost[last] + 1<=cost[to]){
cost[to] = cost[last] + 1;
vector<int> tmp(now);
tmp.push_back(to);
q.push(tmp);
}
}
}
}
return res;
}
bool transformCheck(const string& str1, const string& str2) {
int differences = 0;
for (int i = 0; i < str1.size() && differences < 2; i++) {
if (str1[i] != str2[i]) {
++differences;
}
}
return differences == 1;
}
};
复杂度分析
扩展
由于本题起点和终点固定,所以可以从起点和终点同时开始进行双向广度优先搜索(当下个单词相同时跳出),可以进一步降低时间复杂度。
感想
这题的核心要点其实是题目的析构建模和代码处理上的一些技巧(主要是转化成图);至于实现上用BFS,还是用Dijstra根本无关紧要,万变不离其宗,就是求”单源最短路径“。