98 单词拆分（Word Break）

SeeDoubleU

已于 2024-03-21 01:55:13 修改

阅读量406

点赞数 4

分类专栏：算法 # 动态规划文章标签：算法动态规划

于 2024-03-21 01:49:46 首次发布

本文链接：https://blog.csdn.net/SeeDoubleU/article/details/136893037

版权

算法同时被 2 个专栏收录

108 篇文章 1 订阅

订阅专栏

动态规划

13 篇文章 0 订阅

订阅专栏

文章目录

1 题目

题目：单词拆分（Word Break）
描述：给定字符串 s 和单词字典 dict，确定 s 是否可以分成一个或多个以空格分隔的子串，并且这些子串都在字典中存在。

lintcode题号——107，难度——medium

样例1：

输入：
s = "lintcode"
dict = ["lint", "code"]
输出：true
解释：lintcode可以分成lint和code。

样例2：

输入：
s = "a"
dict = ["a"]
输出：true
解释：a在dict中。

2 解决方案

2.1 思路

使用动态规划的方式解，将状态定义为表示前i个字符可以被顺利拆分成能在字典中找到子串，则如果位置j+1到位置i的子串在字典中，且前j个子串能够顺利拆分，则前i个子串就能够顺利拆分，理清动态规划的四要素即可解出。

序列型动态规划：由于将状态定义成前i个字符的状态，所以前0个对象的状态~前i个对象的状态，一共有i+1个状态，所以容器的长度需要增加一位，注意与坐标型动态规划区分。

2.2 时间复杂度

本题动态规划的多重循环是对同一维的下标进行的，相当于在一个耗时n的循环内嵌套了同为耗时n的循环，时间复杂度为O(n^2)。

2.3 空间复杂度

使用了容量为n的数组，空间复杂度为O(n)。

3 源码

细节：

动态规划的四要素：状态、方程、初始化、答案。（四要素在之前的题目数字三角形¹中有详细介绍）
状态：用dp[i]表示前i个字符可以被顺利拆分成能在字典中找到子串。
方程：如果位置j+1到位置i的子串在字典中，且前j个子串能够顺利拆分，则前i个子串就能够顺利拆分。
初始化：空串为真。
答案：整个字符串是否能被顺利拆分，即dp[max]。

本题需要提前计算字典中的最长单词的长度，用于加速搜索，如果当前子串已经超过字典中最大长度，则更大的子串也不需要再判断了。所以第二重循环中的j要从大到小遍历。

C++版本：

/**
* @param s: A string
* @param wordSet: A dictionary of words dict
* @return: A boolean
*/
bool wordBreak(string &s, unordered_set<string> &wordSet) {
    // write your code here
    if (s.empty())
    {
        return true;
    }

    // 提前计算字典中最长的单词长度
    int maxLength = 0;
    for (auto it : wordSet)
    {
        if (it.size() > maxLength)
        {
            maxLength = it.size();
        }
    }

    // 状态：dp[i]表示前i个字符可以被顺利拆分成能在字典中找到子串
    vector<int> dp(s.size() + 1);

    // 初始化：空串为真
    dp[0] = 1;

    for (int i = 1; i < dp.size(); i++)
    {
        for (int j = i - 1; j >= 0; j--) // 为了加速搜索，j从大到小来循环
        {
            if (i - j > maxLength) // 为了加速搜索，如果j+1到位置i的子串已经超过字典中最大长度，则更大的子串不需要再判断了
            {
                break;
            }

            // 方程：如果位置j+1到位置i的子串在字典中，且前j个子串能够顺利拆分，则前i个子串就能够顺利拆分
            if (wordSet.find(s.substr(j, i - j)) != wordSet.end() && dp[j] == 1)
            {
                dp[i] = 1;
                break;
            }
        }
    }

    return dp[dp.size() - 1]; // 答案：整个字符串是否能被顺利拆分
}