【每日一题】722. 删除注释_删除注释c++题目-CSDN博客

本文链接：https://blog.csdn.net/qq_43779149/article/details/132081202

【每日一题】722. 删除注释

722. 删除注释
- 题目描述
- 解题思路

722. 删除注释

题目描述

给一个 C++ 程序，删除程序中的注释。这个程序source是一个数组，其中source[i]表示第 i 行源码。这表示每行源码由 ‘\n’ 分隔。

在 C++ 中有两种注释风格，行内注释和块注释。

字符串// 表示行注释，表示//和其右侧的其余字符应该被忽略。
字符串/* 表示一个块注释，它表示直到下一个（非重叠）出现的*/之间的所有字符都应该被忽略。（阅读顺序为从左到右）非重叠是指，字符串/*/并没有结束块注释，因为注释的结尾与开头相重叠。
第一个有效注释优先于其他注释。

如果字符串//出现在块注释中会被忽略。
同样，如果字符串/*出现在行或块注释中也会被忽略。
如果一行在删除注释之后变为空字符串，那么不要输出该行。即，答案列表中的每个字符串都是非空的。

样例中没有控制字符，单引号或双引号字符。

比如，source = “string s = “/* Not a comment. */”;” 不会出现在测试样例里。
此外，没有其他内容（如定义或宏）会干扰注释。

我们保证每一个块注释最终都会被闭合，所以在行或块注释之外的/*总是开始新的注释。

最后，隐式换行符可以通过块注释删除。有关详细信息，请参阅下面的示例。

从源代码中删除注释后，需要以相同的格式返回源代码。

示例 1:

输入: source = ["/*Test program */", "int main()", "{ ", "  // variable declaration ", "int a, b, c;", "/* This is a test", "   multiline  ", "   comment for ", "   testing */", "a = b + c;", "}"]
输出: ["int main()","{ ","  ","int a, b, c;","a = b + c;","}"]
解释: 示例代码可以编排成这样:
/*Test program */
int main()
{ 
  // variable declaration 
int a, b, c;
/* This is a test
   multiline  
   comment for 
   testing */
a = b + c;
}
第 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。
编排后: 
int main()
{ 
  
int a, b, c;
a = b + c;
}

示例 2:

输入: source = ["a/*comment", "line", "more_comment*/b"]
输出: ["ab"]
解释: 原始的 source 字符串是 "a/*comment\nline\nmore_comment*/b", 其中我们用粗体显示了换行符。删除注释后，隐含的换行符被删除，留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].

提示:

1 <= source.length <= 100
0 <= source[i].length <= 80
source[i] 由可打印的 ASCII 字符组成。
每个块注释都会被闭合。
给定的源码中不会有单引号、双引号或其他控制字符。

解题思路

思路：既然我们需要按行删除注释并返回源代码，那么一个字符只有两种情况，要么在注释中，要么不在注释中，此时我们使用一个布尔变量in_block标志当前字符是否在注释中。当in_block为F，此时分为三种情况：第一种是/*，这时我们需要将in_block设置为T，并从/*后面的第一个字符开始查找；第二种是//，这时我们需要直接break跳过后续字符；第三种是其他情况，我们则收录当前字符。当in_block为T，此时表明前面找到/*，这时我们需要找到*/，然后找到后再将in_block设为F。

class Solution {
public:
    vector<string> removeComments(vector<string>& source) {
        vector<string> res;
        string new_line="";
        bool in_block=false;
        for(auto &line:source)
        {
            int n=line.size();
            for(int i=0;i<n;i++)
            {
                // 在注释块 /* 等*/
                if(in_block)
                {
                    // 设置完后继续遍历后续内容 */后面可能有//
                    if(i+1<n&&line[i]=='*'&&line[i+1]=='/')
                    {
                        in_block=false;
                        i++; //后续for循环i会继续加一 即到达/*后面的第一个字符
                    }
                }
                // 不在注释块中
                else{
                    // 注释块 接着/*后面第一个开始遍历
                    if(i+1<n&&line[i]=='/'&&line[i+1]=='*')
                    {
                        in_block=true;
                        i++; //后续for循环i会继续加一 即到达/*后面的第一个字符
                    }
                    // 注释块 跳过后面内容
                    else if(i+1<n&&line[i]=='/'&&line[i+1]=='/')
                        break;
                    // 该字符不在注释块中直接加入结果
                    else 
                        new_line+=line[i];
                }
            }
            // start&&end使得in_block变为false而flag不会改变in_block
            if(!in_block&&new_line!="")
            {
                res.push_back(new_line);
                new_line="";
            }
        }
        return res;
    }
};

总结：这种按照字符是否在注释中设置标志变量就十分巧妙！！！

原来思路：一开始我的思路是，对于每一个字符串，设置start表示/*是否找到，设置end表示*/是否找到，设置flag表示//是否找到，然后设置双指针l和r，其中l从左向右找/*或者//，并且两者不能交叉，r从右向左找*/，并且不能与/*有重叠，最后处理收录部分，这样反而还出错了。因为有可能一个字符串中同时包含*/和*//，那么从右向左找就会出错。（血泪教训，还是老老实实遍历吧）

class Solution {
public:
    vector<string> removeComments(vector<string>& source) {
        // ["a/*/b//*c","blank","d/*/e*//f"] 猝死在这里
        // 问题在于我最后找到*/就完了 
        // 但实际上是d/*/的*/ 和//f的//
        vector<string> res;
        int n=source.size();
        string subs="";
        bool flag=false;
        bool start=false;
        bool end=false;
        for(int i=0;i<n;i++)
        {
            int m=source[i].size();
            int l=0,r=m-1;
            while(l<r)
            {
                // 左边开始找//找到就截取前面部分
                // 同时防止与第一个交叉防止交叉
                if(source[i][l]=='/'&&source[i][l+1]=='/'&&!start&&!flag)
                {
                    subs+=source[i].substr(0,l);
                    flag=true;
                    break;
                }
                // 左边开始找/*找到就截取前面部分
                if(source[i][l]=='/'&&source[i][l+1]=='*'&&!start)
                {
                    subs+=source[i].substr(0,l);
                    start=true;
                }
                // 控制一下 start为假才加一 否则不动  让end开始查找 
                // 避免" */ return 0;"这种end被start跳过了
                else if(!start)
                    l++;
                // 右边开始找*/找到就截取后面部分
                // r-l>=3控制左右不重复
                if(source[i][r]=='/'&&source[i][r-1]=='*'&&r-l>=3&&!end)
                {
                    subs+=r==m-1?"":source[i].substr(r+1);
                    end=true;
                }
                else
                    r--;
            }
            if(start||end||flag)
            {
                if(start&&end)
                {
                    if(subs!="")
                    {
                        int ll=subs.size();
                        // 清空*/ 后续的//后面的内容 
                        for(int k=0;k+1<ll;k++)
                        {
                            if(subs[k]=='/'&&subs[k+1]=='/')
                            {
                                subs=subs.substr(0,k);
                                break;
                            }
                        }
                        res.push_back(subs);
                    }
                    start=false;
                    end=false;
                    subs="";
                }
                else if(flag)
                {
                    if(subs!="")
                        res.push_back(subs);
                    flag=false;
                    subs="";
                }
                // start没有但是有end
                // ["void func(int k) {", "// this function does nothing /*", "   k = k*2/4;", "   k = k/2;*/", "}"]
                else if(!start&&end)
                {
                    res.push_back(source[i]);
                    start=false;
                    end=false;
                    subs="";
                }
            }
            else
                res.push_back(source[i]);
        }
        return res;
    }
};