给定一个单词列表,我们将这个列表编码成一个索引字符串 S 与一个索引列表 A。
例如,如果这个列表是 ["time", "me", "bell"],我们就可以将其表示为 S = "time#bell#" 和 indexes = [0, 2, 5]。
对于每一个索引,我们可以通过从字符串 S 中索引的位置开始读取字符串,直到 "#" 结束,来恢复我们之前的单词列表。
那么成功对给定单词列表进行编码的最小字符串长度是多少呢?
示例:
输入: words = ["time", "me", "bell"]
输出: 10
说明: S = "time#bell#" , indexes = [0, 2, 5] 。
提示:
1 <= words.length <= 2000
1 <= words[i].length <= 7
每个单词都是小写字母 。
首先用哈希去重,然后每次算是否是后缀字符串,
如果是后缀字符串则将该子字符串去掉。然后总长度再加上“#”号的长度即可。
开头一直在算字串。字串和后缀字串是两个概念。
#include <iostream>
#include <vector>
#include <string>
#include <algorithm>
#include <unordered_set>
using namespace std;
class Solution {
public:
int minimumLengthEncoding(vector<string>& words) {
unordered_set<string> m_set;
for (int i = 0; i < words.size(); i++) {
m_set.insert(words[i]);
}
for (int i = 0; i < words.size(); i++) {
for (int j = 1; j < words[i].length(); j++) {
string str = words[i].substr(j);
m_set.erase(str);
}
}
int sum = 0;
unordered_set<string>::iterator it = m_set.begin();
while (it != m_set.end()) {
sum += (*it).length();
it++;
}
sum += m_set.size();
return sum;
}
};
int main() {
Solution* ps = new Solution();
vector<string> s1 = { "time", "me", "bell" };
vector<string> s2 = { "time", "me" };
vector<string> s3 = { "me", "time" };
vector<string> s4 = { "time", "time" ,"time" ,"time" };
cout << ps->minimumLengthEncoding(s1) << endl;
return 0;
}