LeetCode 2157. 字符串分组

给你一个下标从 0 开始的字符串数组 words 。每个字符串都只包含 小写英文字母 。words 中任意一个子串中,每个字母都至多只出现一次。

如果通过以下操作之一,我们可以从 s1 的字母集合得到 s2 的字母集合,那么我们称这两个字符串为 关联的 :

往 s1 的字母集合中添加一个字母。
从 s1 的字母集合中删去一个字母。
将 s1 中的一个字母替换成另外任意一个字母(也可以替换为这个字母本身)。
数组 words 可以分为一个或者多个无交集的 组 。如果一个字符串与另一个字符串关联,那么它们应当属于同一个组。

注意,你需要确保分好组后,一个组内的任一字符串与其他组的字符串都不关联。可以证明在这个条件下,分组方案是唯一的。

请你返回一个长度为 2 的数组 ans :

ans[0] 是 words 分组后的 总组数 。
ans[1] 是字符串数目最多的组所包含的字符串数目。
 

示例 1:

输入:words = ["a","b","ab","cde"]
输出:[2,3]
解释:
- words[0] 可以得到 words[1] (将 'a' 替换为 'b')和 words[2] (添加 'b')。所以 words[0] 与 words[1] 和 words[2] 关联。
- words[1] 可以得到 words[0] (将 'b' 替换为 'a')和 words[2] (添加 'a')。所以 words[1] 与 words[0] 和 words[2] 关联。
- words[2] 可以得到 words[0] (删去 'b')和 words[1] (删去 'a')。所以 words[2] 与 words[0] 和 words[1] 关联。
- words[3] 与 words 中其他字符串都不关联。
所以,words 可以分成 2 个组 ["a","b","ab"] 和 ["cde"] 。最大的组大小为 3 。
示例 2:

输入:words = ["a","ab","abc"]
输出:[1,3]
解释:
- words[0] 与 words[1] 关联。
- words[1] 与 words[0] 和 words[2] 关联。
- words[2] 与 words[1] 关联。
由于所有字符串与其他字符串都关联,所以它们全部在同一个组内。
所以最大的组大小为 3 。
 

提示:

1 <= words.length <= 2 * 104
1 <= words[i].length <= 26
words[i] 只包含小写英文字母。
words[i] 中每个字母最多只出现一次。

来源:力扣(LeetCode)
链接:https://leetcode-cn.com/problems/groups-of-strings
 

解法:

状态压缩+并查集/bfs/dfs。本题难点应该是没想到用状态压缩来枚举每个字符串可以关联的字符串。一般思路是两个for循环,字符串两两尝试关联,但时间复杂度过高,为O(n^{2})。我们可以用26位二进制数来对字符串进行状态压缩, 其中第i位为1,则表示字符串中含有字母(i+‘a’),根据关联条件,我们可以得到两字符串关联只能是如下情况:

1. s1中有一个二进制位为1,而s2中对应位置为0,其余相同(或者 s2中有一个二进制位为1,而s1中对应位置为0,其余相同).

2.s1中有一个二进制位为1,而s2中对应位置为0,同时s2中有一个二进制位为1,而s1中对应位置为0,其余形同。

首先我们用哈希表记录每个字符串的二进制状态, 而后对一个字符串的二进制状态进行可关联枚举。而后用并查集寻找有几个连通分量,和最大分量数。时间复杂度为 n*26*26

class Solution {
	unordered_map<int, int> p, sz;	//并查集,哈希写法
	int max_size, gp;

	int find(int x)
	{
		if (p[x] != x)
			p[x] = find(p[x]);
		return p[x];
	}


	void merge(int x, int y)
	{
		if (!p.count(y)) return;
		int fx = find(x);
		int fy = find(y);
        if(fx == fy) return;
		p[fx] = fy;
		sz[fy] += sz[fx];
		max_size = max(max_size, sz[fy]);
		--gp;
	}

public:
	vector<int> groupStrings(vector<string>& words) {
		max_size = 0;
		gp = words.size();
		for (auto &word : words)
		{
			int x = 1 << 26;
			for (auto &s : word)
			{
				x = x | (1 << (s - 'a'));
			}
			p[x] = x;
			++sz[x];
			if (sz[x] > 1) --gp;
			max_size = max(max_size, sz[x]);
		}

		for (auto &pp : p)
		{
			int mask = pp.first;
			for (int i = 0; i < 26; ++i)
			{
				merge(mask, mask ^ (1 << i));    //添加或者删除字母
				if (mask & (1 << i))
				{
					for (int j = 0; j < 26; ++j)
					{
						if ((mask & (1 << j)) == 0)
						{
							merge(mask, mask ^ (1 << i) ^ (1 << j));    //将字母‘a’+i替换为‘a’+j
						}
					}
				}
			}
		}
		return{ gp, max_size };
	}
};

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值