763. 划分字母区间（力扣LeetCode）

最新推荐文章于 2024-05-03 23:40:51 发布

命运从未公平

最新推荐文章于 2024-05-03 23:40:51 发布

阅读量876

点赞数 9

分类专栏： leetcode 文章标签： leetcode c++ 贪心算法哈希算法

本文链接：https://blog.csdn.net/m0_73841621/article/details/137062244

版权

leetcode 专栏收录该内容

72 篇文章 0 订阅

订阅专栏

763. 划分字母区间

题目描述

给你一个字符串 s 。我们要把这个字符串划分为尽可能多的片段，同一字母最多出现在一个片段中。

注意，划分结果需要满足：将所有划分结果按顺序连接，得到的字符串仍然是 s 。

返回一个表示每个字符串片段的长度的列表。

示例 1：

输入：s = “ababcbacadefegdehijhklij”
输出：[9,7,8]
解释：
划分结果为 “ababcbaca”、“defegde”、“hijhklij” 。
每个字母最多出现在一个片段中。
像 “ababcbacadefegde”, “hijhklij” 这样的划分是错误的，因为划分的片段数较少。

示例 2：

输入：s = “eccbbbbdec”
输出：[10]

提示：

1 <= s.length <= 500
s 仅由小写英文字母组成

贪心算法

一想到分割字符串就想到了回溯，但本题其实不用回溯去暴力搜索。

题目要求同一字母最多出现在一个片段中，那么如何把同一个字母的都圈在同一个区间里呢？

如果没有接触过这种题目的话，还挺有难度的。

在遍历的过程中相当于是要找每一个字母的边界，如果找到之前遍历过的所有字母的最远边界，说明这个边界就是分割点了。此时前面出现过所有字母，最远也就到这个边界了。

可以分为如下两步：

统计每一个字符最后出现的位置
从头遍历字符，并更新字符的最远出现下标，如果找到字符最远出现位置下标和当前下标相等了，则找到了分割点

如图：
在这里插入图片描述

rfind函数

以下是对于给出的代码的详细注释，解释了它是如何解决问题的：

#include <vector>
#include <string>
using namespace std;

class Solution {
public:
    vector<int> partitionLabels(string s) {
        vector<int> res; // 用于存储每个片段的长度
        int end=0; // 记录当前遍历到的所有字符中，最远的出现位置
        int cnt=0; // 当前片段的长度计数器

        // 遍历给定的字符串
        for(int i=0; i<s.size(); i++) {
            cnt++; // 每遍历一个字符，当前片段的长度加1
            // 更新当前片段中字符最远出现位置的最大值
            // s.rfind(s[i]) 返回字符s[i]最后一次出现的位置
            // 因为s.rfind的返回类型为size_t，可能与int类型的end不匹配，所以要进行类型转换
            end = max(end, (int)s.rfind(s[i]));

            // 如果当前字符是当前片段中最远出现位置的字符，
            // 则说明到目前为止的这一段可以独立为一个片段
            if (end == i) {
                // 将当前片段的长度添加到结果列表中
                res.push_back(cnt);

                // 重置计数器为下一个片段做准备
                cnt = 0;
            }
        }
        // 返回结果列表，包含了每个片段的长度
        return res;
    }
};

这段代码核心在于，通过遍历字符串，并使用end变量跟踪当前遍历到的所有字符中最远的出现位置。每当end与当前遍历的索引i相等时，说明到目前为止的这一段字符串可以划分为一个片段，因为它包含了一组字符，这些字符之后不再出现。然后，记录下这个片段的长度，并重置计数器和end变量，以便计算下一个片段的长度。最终，所有片段的长度被添加到结果列表中并返回。

易错：rfind函数返回值问题

在我没进行强制类型转换时，代码报错

Line 10: Char 17: error: no matching function for call to 'max'
   10 |             end=max(end,s.rfind(s[i]));
      |                 ^~~
/usr/bin/../lib/gcc/x86_64-linux-gnu/11/../../../../include/c++/11/bits/algorithmfwd.h:407:5: note: candidate template ignored: deduced conflicting types for parameter '_Tp' ('int' vs. 'size_type' (aka 'unsigned long'))
  398 |     max(const _Tp&, const _Tp&);
      |     ^
/usr/bin/../lib/gcc/x86_64-linux-gnu/11/../../../../include/c++/11/bits/stl_algo.h:3467:5: note: candidate template ignored: could not match 'initializer_list<_Tp>' against 'int'
 3458 |     max(initializer_list<_Tp> __l, _Compare __comp)
      |     ^

这个错误信息表明max函数无法匹配到合适的重载版本，原因是传递给max的两个参数end和s.rfind(s[i])具有不同的类型。在C++中，rfind返回的是size_type类型，这通常是一个无符号整数类型（比如unsigned long），而end被定义为int类型，是一个有符号整数。

在C++标准库中，max要求两个参数具有相同的类型，因为它需要能够比较这两个参数并返回其中较大的一个。当你尝试使用两个不同类型的参数调用max时，编译器无法决定应该使用哪个类型来比较，因此会报错。

解决这个问题的一种方法是，确保max的两个参数类型一致。如果你确认end变量不会存储超过int类型能表示的范围的值，可以通过强制类型转换将rfind的返回值转换为int类型，如下所示：

end = max(end, (int)s.rfind(s[i]));

哈希表

这段代码是一个解决上述问题的C++实现。我将在代码的每一部分提供详细的注释来解释它的作用。

#include <vector>
#include <string>

using namespace std;

class Solution {
public:
    vector<int> partitionLabels(string s) {
        vector<int> res; // 创建一个空的整数向量来存储最后的片段长度结果

        // 数组用于记录每个字符最后出现的索引位置
        // 因为输入字符串只包含小写字母，所以只需要大小为26的数组
        int index[26];

        // 第一个循环遍历字符串s的每个字符
        for(int i = 0; i < s.size(); i++)
            // 计算字符到'a'的距离，作为数组索引，并更新这个字符对应的最后出现位置
            // 'a'的ASCII码将被用作基准点，所以任何字符都可以通过减去'a'得到一个0到25的索引值
            index[s[i] - 'a'] = i;

        // 初始化用于追踪当前片段最右端字符的索引
        int right = 0;
        int cnt = 0; // 计数器，用于记录当前片段的长度

        // 第二个循环同样遍历字符串的每个字符
        for(int i = 0; i < s.size(); i++) {
            // 增加当前片段的计数器
            cnt++;
            // 通过字符索引，找到当前片段最右端字符的索引，与当前的`right`比较，取较大者
            // 这样可以确保当前片段包含所有已遍历字符的最后出现
            right = max(right, index[s[i] - 'a']);

            // 如果当前字符的位置i与`right`相等，说明当前片段不会再扩展了
            if(right == i) {
                // 把当前片段的长度加入到结果集
                res.push_back(cnt);
                // 重置计数器，为下一个片段准备
                cnt = 0;
            }
        }
        // 返回分段的长度数组
        return res;
    }
};

该代码分为两个主要部分：第一部分遍历字符串，记录每个字符最后出现的位置；第二部分再次遍历字符串，根据每个字符的最后出现位置，确定每个片段的边界并记录其长度。

这种方法能够确保每个字符仅出现在一个片段中，且得到的片段数目是最大化的。最终，我们得到一个数组，记录了根据给定规则得到的每个片段的长度。

命运从未公平

关注

9
点赞
踩
17

收藏

觉得还不错? 一键收藏
打赏
0
评论
763. 划分字母区间（力扣LeetCode）

给你一个字符串 s。我们要把这个字符串划分为尽可能多的片段，同一字母最多出现在一个片段中。注意，划分结果需要满足：将所有划分结果按顺序连接，得到的字符串仍然是 s。返回一个表示每个字符串片段的长度的列表。输入：s = “ababcbacadefegdehijhklij”输出：[9,7,8]解释：划分结果为 “ababcbaca”、“defegde”、“hijhklij”。每个字母最多出现在一个片段中。
复制链接

扫一扫