Leetcode--恢复空格

题目描述:

哦,不!你不小心把一个长篇文章中的空格、标点都删掉了,并且大写也弄成了小写。像句子"I reset the computer. It still didn’t boot!“已经变成了"iresetthecomputeritstilldidntboot”。在处理标点符号和大小写之前,你得先把它断成词语。当然了,你有一本厚厚的词典dictionary,不过,有些词没在词典里。假设文章用sentence表示,设计一个算法,把文章断开,要求未识别的字符最少,返回未识别的字符数。

示例:
输入:
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
sentence = “jesslookedjustliketimherbrother”
输出: 7
解释: 断句后为"jess looked just like tim her brother",共7个未识别字符。

提示:
0 <= len(sentence) <= 1000
dictionary中总字符数不超过 150000。
你可以认为dictionary和sentence中只包含小写字母。

分析:

这个题刚拿到的时候,看到题目要求是要求未识别字符最少为多少,立即想到了动态规划—
定义dp[i],表示前i个字符的未识别字符的最少数,依次遍历sentence中的字符,如果指针遇到有以该字符结尾的词语,就去遍历词语,同时向前遍历这个指针,看指针j移动的字符是否是词典里的字符,直到词典中的字符遍历结束,对应的j指针与词典中的对应字符都没有出现不同,dp[i] = min(dp[j-1],dp[i]+1),dp[i]+1表示这个字符未被识别,有的人可能认为dp[j-1]一定小于dp[i]+1,但是不一定,我们要考虑到词典中的字符杂糅到一起的情况,此时我发现我们需要一个数据结构来逆置的保存词典中的词语,以便来判断以是否有以s[i]结尾并且s[i-1]s[i-2]s[i-3]…都满足于一个词语,这时我就无从下手了。
看了解析后我发现答案给出的是字典树的结构来保存这组数据。
例如:
dictionary = [“looked”,“just”,“like”,“her”,“brother”]
用一颗字典树来表示:
字典树
这时我们就可以实现代码了!

代码:

//字典树结构的定义!!!
class Trie {
public:
    Trie* next[26] = {nullptr}; ///0位置表示'a',1位置表示'b'...
    bool isEnd;///用来表示是否为一个词的结尾

    Trie()
    {
        isEnd = false;
    }

    void insert(string s) 
    {
        Trie* curPos = this;
       //从后往前遍历一个词语,将词语逆置的存放到字典树中
        for (int i = s.length() - 1; i >= 0; --i) 
        {
            int t = s[i] - 'a';将字符化解为数字来存放
            if (curPos->next[t] == nullptr) 
            {
                curPos->next[t] = new Trie();
            }
            curPos = curPos->next[t];
        }
        curPos->isEnd = true;///词语遍历结束后
    }
};


int respace(vector<string>& dictionary, string sentence) {
        int n = sentence.length(), inf = 0x3f3f3f3f;

        Trie* root = new Trie();
        for (auto& word: dictionary) 
        {
            root->insert(word);
        }

        vector<int> dp(n + 1, inf);///dp容器开辟n+1个,初始化为inf
        dp[0] = 0;
        for (int i = 1; i <= n; ++i) 
        {
            dp[i] = dp[i - 1] + 1;
            Trie* curPos = root;
            for (int j = i; j >= 1; --j) 
            {
                int t = sentence[j - 1] - 'a';
                if (curPos->next[t] == nullptr) ///如果没有以s[i]结尾的词语,直接退出
                {
                    break;
                } else if (curPos->next[t]->isEnd) 
                {
                    dp[i] = min(dp[i], dp[j - 1]);
                }
                if (dp[i] == 0)
                {
                    break;
                }
                /dp[i] == 0表示前i个字符串的被识别字符为0,这题是求最少的被识别字符,
                因为没有比0更少的了, 所以j可以不继续往前遍历了,直接退出,
                break相当于一个小优化,所以删掉也可以
                curPos = curPos->next[t];
            }
        }
        return dp[n];
    }

注意事项:

字典树结构的定义方法一定要掌握!!!!

注意这种表示方法:
for (auto& word: dictionary)
{
root->insert(word);
}
这是c++11的新特性,范围for,相当于java的for each。dictionary是一个可遍历的容器或流,比如vector类型,word就用来在遍历过程中获得容器里的每一个元素。
例如:vector v={1,2,3,4};
for(auto i:v)
cout<<i;
结果就是1234

LeetCode-Editor是一种在线编码工具,它提供了一个用户友好的界面编写和运行代码。在使用LeetCode-Editor时,有时候会出现乱码的问题。 乱码的原因可能是由于编码格式不兼容或者编码错误导致的。在这种情况下,我们可以尝试以下几种解决方法: 1. 检查文件编码格式:首先,我们可以检查所编辑的文件的编码格式。通常来说,常用的编码格式有UTF-8和ASCII等。我们可以将编码格式更改为正确的格式。在LeetCode-Editor中,可以通过界面设置或编辑器设置来更改编码格式。 2. 使用正确的字符集:如果乱码是由于使用了不同的字符集导致的,我们可以尝试更改使用正确的字符集。常见的字符集如Unicode或者UTF-8等。在LeetCode-Editor中,可以在编辑器中选择正确的字符集。 3. 使用合适的编辑器:有时候,乱码问题可能与LeetCode-Editor自身相关。我们可以尝试使用其他编码工具,如Text Editor、Sublime Text或者IDE,看是否能够解决乱码问题。 4. 查找特殊字符:如果乱码问题只出现在某些特殊字符上,我们可以尝试找到并替换这些字符。通过仔细检查代码,我们可以找到导致乱码的特定字符,并进行修正或替换。 总之,解决LeetCode-Editor乱码问题的方法有很多。根据具体情况,我们可以尝试更改文件编码格式、使用正确的字符集、更换编辑器或者查找并替换特殊字符等方法来解决这个问题。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值