单词的压缩编码
给定一个单词列表,我们将这个列表编码成一个索引字符串 S 与一个索引列表 A。
例如,如果这个列表是 [“time”, “me”, “bell”],我们就可以将其表示为 S = “time#bell#” 和 indexes = [0, 2, 5]。
对于每一个索引,我们可以通过从字符串 S 中索引的位置开始读取字符串,直到 “#” 结束,来恢复我们之前的单词列表。
那么成功对给定单词列表进行编码的最小字符串长度是多少呢?
示例:
输入: words = [“time”, “me”, “bell”]
输出: 10
说明: S = “time#bell#” , indexes = [0, 2, 5] 。
提示:
1 <= words.length <= 2000
1 <= words[i].length <= 7
每个单词都是小写字母 。
解题思路:
如果一个字符串(例如:me)和另一个字符串(例如:time)的后缀一样,则可合并为一个字符串。因此依次扫描判断字符串可否被合并。
将words放入unorder_set容器中,依次截取words的每个字符串,如time依次截取出(ime,me,e),若unorder_set中存在截取出的字符串,则擦除,最后计算unorder_set中每个字符串长度再加1(即#的位置)即可。
unorder_set容器的特点是存储值唯一。
class Solution {
public:
int minimumLengthEncoding(vector<string>& words) {
unordered_set<string> s1(words.begin(),words.end());
for (const string & word : words){
for (int i=1;i<word.size();++i){
s1.erase(word.substr(i));
}
}
int max=0;
for (const string & word:s1){
max+=word.size()+1;
}return max;
}
};