【LeetCode】1233. 删除子文件夹

Schanappi

已于 2023-02-08 15:07:47 修改

阅读量400

点赞数

分类专栏： LeetCode刷题文章标签： leetcode 算法职场和发展

于 2023-02-08 12:10:29 首次发布

本文链接：https://blog.csdn.net/weixin_43894455/article/details/128930859

版权

LeetCode刷题专栏收录该内容

218 篇文章 6 订阅

订阅专栏

1233. 删除子文件夹

题目描述

你是一位系统管理员，手里有一份文件夹列表 folder，你的任务是要删除该列表中的所有子文件夹，并以任意顺序返回剩下的文件夹。

如果文件夹 folder[i] 位于另一个文件夹 folder[j] 下，那么 folder[i] 就是 folder[j] 的子文件夹。

文件夹的「路径」是由一个或多个按以下格式串联形成的字符串：‘/’ 后跟一个或者多个小写英文字母。

例如，“/leetcode” 和 “/leetcode/problems” 都是有效的路径，而空字符串和 “/” 不是。

示例 1

输入：folder = [“/a”,“/a/b”,“/c/d”,“/c/d/e”,“/c/f”]
输出：[“/a”,“/c/d”,“/c/f”]
解释：“/a/b” 是 “/a” 的子文件夹，而 “/c/d/e” 是 “/c/d” 的子文件夹。

示例 2

输入：folder = [“/a”,“/a/b/c”,“/a/b/d”]
输出：[“/a”]
解释：文件夹 “/a/b/c” 和 “/a/b/d” 都会被删除，因为它们都是 “/a” 的子文件夹。

示例 3

输入: folder = [“/a/b/c”,“/a/b/ca”,“/a/b/d”]
输出: [“/a/b/c”,“/a/b/ca”,“/a/b/d”]

提示

1 <= folder.length <= 4 * 10⁴
2 <= folder[i].length <= 100
folder[i] 只包含小写字母和 ‘/’
folder[i] 总是以字符 ‘/’ 起始
每个文件夹名都是唯一的

算法一：排序

思路

先将数组 folder 按照字典序排序，然后遍历数组，对于当前遍历到的文件夹 f ，如果它的长度大于等于答案数组中最后一个文件夹的长度，并且它的前缀包含答案数组的最后一个文件夹再加上 / ，则说明 f 是答案数组中最后一个文件夹的子文件夹，我们不需要将其加入答案数组中，否则，将 f 加入答案数组。
遍历结束后，答案数组中的文件夹即为题目要求的答案。

收获

我有想到排序，使得 folder 里的文件夹按照字典序排序。
对于子文件夹的判断，我是想用 c++ 的 strstr 函数，它能够判断 str1 是否是 str2 的子串，但是不知道为什么这个函数没办法成功；
题解用了 if 语句判断当前文件夹是否是子文件夹。

算法情况

时间复杂度：O（n* log n * m）；
空间复杂度：O（m），其中 n 和 m 分别是数组 folder 的长度和数组 folder 中字符串的最大长度。

代码

class Solution {
public:
    vector<string> removeSubfolders(vector<string>& folder) {
        sort(folder.begin(), folder.end());
        int n = folder.size();
        
        vector<string> ans = {folder[0]};
        for(int i=1; i<n; ++i){
            int m = ans.back().size();
            int n = folder[i].size();
            if(m >= n || !(ans.back() == folder[i].substr(0, m) && folder[i][m] == '/'))
                ans.emplace_back(folder[i]);
        }    

        return ans;
    }
};

算法二：字典树 + stringstrem分割

思路

使用字典树存储数组 folder 中的所有文件夹，字典树的每个节点包含 children 字段，用于存储当前节点的子节点，以及 fid 字段，用于存储当前节点对应的文件夹在数组 folder 中的下标。
对于数组 folder 中的每个文件夹 f ，我们先将 f 按照 / 分割成若干个子串，然后从根节点开始，依次将子串加入字典树中。接下来，我们从根节点开始搜索字典树，如果当前节点的 fid 字段不为 -1，则说明当前节点对应的文件夹是答案数组中的一个文件夹，我们将其加入答案数组并返回。否则，我们递归地搜索当前节点的所有子节点，最终返回答案数组。

收获

当遇到 fid != -1 的节点就可以停止回溯了。

算法情况

时间复杂度：O（n * m）
空间复杂度：O（n * m），其中 n 和 m 分别是数组 folder 的长度和数组 folder 中字符串的最大长度。

在这里插入图片描述

代码

class Trie{
public:
    void insert(int fid, string& f){
        Trie* node = this;
        // 将字符串分割
        vector<string> ps = split(f, '/');
        for(int i=1; i < ps.size(); ++i){
            auto& p = ps[i];
            // 不存在这个节点，那么就创造
            if(!node->children.count(p)){
                node->children[p] = new Trie();
            }
            node = node -> children[p];
        }
        node->fid = fid;
    }

    vector<int> search(){
        vector<int> ans;
        function<void(Trie*)> dfs = [&](Trie* root){
            if(root->fid != -1){
                ans.push_back(root->fid);
                return;
            }
            for(auto& [_, child] : root -> children){
                dfs(child);
            }
        };
        dfs(this);
        return ans;
    }

    vector<string> split(string& s, char delim){
        stringstream ss(s);
        string item;
        vector<string> res;
        while(getline(ss, item, delim)){
            res.emplace_back(item);
        }
        return res;
    }

private:
    unordered_map<string, Trie*> children;
    int fid = -1;
};
class Solution {
public:
    vector<string> removeSubfolders(vector<string>& folder) {
        Trie* trie = new Trie();
        for(int i=0; i < folder.size(); ++i){
            trie -> insert(i, folder[i]);
        }
        vector<string> ans;
        for(int i : trie->search()){
            ans.emplace_back(folder[i]);
        }
        return ans;
    }
};