来源:力扣(LeetCode)
描述:
给一个 C++ 程序,删除程序中的注释。这个程序source
是一个数组,其中source[i]
表示第 i
行源码。 这表示每行源码由 '\n'
分隔。
在 C++ 中有两种注释风格,行内注释和块注释。
- 字符串// 表示行注释,表示//和其右侧的其余字符应该被忽略。
- 字符串/* 表示一个块注释,它表示直到下一个(非重叠)出现的*/之间的所有字符都应该被忽略。(阅读顺序为从左到右)非重叠是指,字符串/*/并没有结束块注释,因为注释的结尾与开头相重叠。
第一个有效注释优先于其他注释。
- 如果字符串//出现在块注释中会被忽略。
- 同样,如果字符串/*出现在行或块注释中也会被忽略。
如果一行在删除注释之后变为空字符串,那么 不要 输出该行。即,答案列表中的每个字符串都是非空的。
样例中 没有 控制字符,单引号或双引号字符。
- 比如,source = “string s = “/* Not a comment. */”;” 不会出现在测试样例里。
此外,没有其他内容(如定义或宏)会干扰注释。
我们保证每一个块注释最终都会被闭合, 所以在行或块注释之外的/*总是开始新的注释。
最后,隐式换行符 可以 通过块注释删除。 有关详细信息,请参阅下面的示例。
从源代码中删除注释后,需要以相同的格式返回源代码。
示例 1:
输入: source = ["/*Test program */", "int main()", "{ ", " // variable declaration ", "int a, b, c;", "/* This is a test", " multiline ", " comment for ", " testing */", "a = b + c;", "}"]
输出: ["int main()","{ "," ","int a, b, c;","a = b + c;","}"]
解释: 示例代码可以编排成这样:
/*Test program */
int main()
{
// variable declaration
int a, b, c;
/* This is a test
multiline
comment for
testing */
a = b + c;
}
第 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。
编排后:
int main()
{
int a, b, c;
a = b + c;
}
示例 2:
输入: source = ["a/*comment", "line", "more_comment*/b"]
输出: ["ab"]
解释: 原始的 source 字符串是 "a/*comment\nline\nmore_comment*/b", 其中我们用粗体显示了换行符。删除注释后,隐含的换行符被删除,留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].
提示:
- 1 <= source.length <= 100
- 0 <= source[i].length <= 80
- source[i] 由可打印的 ASCII 字符组成。
- 每个块注释都会被闭合。
- 给定的源码中不会有单引号、双引号或其他控制字符。
方法:模拟
思路与算法
我们需要逐行分析源代码。每个字符有两种情况,要么在一个注释内要么不在。因此我们用 in_block 变量来标记状态,该变量为 true 表示在注释内,反之则不在。
假设此刻不在注释块内:
- 遇到 ‘/*’,则将状态改为在注释块内,继续遍历后面第三个字符。
- 遇到 ‘//’,则直接忽略该行后面的部分。
- 遇到其他字符,将该字符记录到 new_line 中。
假设此刻在注释块内,遇到 ‘*/’,则将状态改为不在注释块内,继续遍历后面第三个字符。
我们用 new_line 记录新的一行,当遍历到每行的末尾时,如果不在注释块内并且 new_line 不为空,就把它放入答案中。
代码:
class Solution {
public:
vector<string> removeComments(vector<string>& source) {
vector<string> res;
string new_line = "";
bool in_block = false;
for (auto& line : source) {
for (int i = 0; i < line.size(); i++) {
if (in_block) {
if (i + 1 < line.size() && line[i] == '*' && line[i + 1] == '/') {
in_block = false;
i++;
}
} else {
if (i + 1 < line.size() && line[i] == '/' && line[i + 1] == '*') {
in_block = true;
i++;
} else if (i + 1 < line.size() && line[i] == '/' && line[i + 1] == '/') {
break;
} else {
new_line += line[i];
}
}
}
if (!in_block && new_line != "") {
res.push_back(new_line);
new_line = "";
}
}
return res;
}
};
执行用时:0 ms, 在所有 C++ 提交中击败了100.00%的用户
内存消耗:7.5 MB, 在所有 C++ 提交中击败了77.52%的用户
复杂度分析
- 时间复杂度:O(nm),其中 n 是 source 的长度,m 是 source[i] 的最大长度。
- 空间复杂度:O(nm)。在极端情况下,每一行的隐式换行符都被块注释删除,new_line 的长度将会达到 O(nm)。
author:LeetCode-Solution