722. 删除注释
题目描述
给一个 C++ 程序,删除程序中的注释。这个程序source是一个数组,其中source[i]表示第 i 行源码。 这表示每行源码由 ‘\n’ 分隔。
在 C++ 中有两种注释风格,行内注释和块注释。
字符串// 表示行注释,表示//和其右侧的其余字符应该被忽略。
字符串/* 表示一个块注释,它表示直到下一个(非重叠)出现的*/之间的所有字符都应该被忽略。(阅读顺序为从左到右)非重叠是指,字符串/*/并没有结束块注释,因为注释的结尾与开头相重叠。
第一个有效注释优先于其他注释。
如果字符串//出现在块注释中会被忽略。
同样,如果字符串/*出现在行或块注释中也会被忽略。
如果一行在删除注释之后变为空字符串,那么不要输出该行。即,答案列表中的每个字符串都是非空的。
样例中没有控制字符,单引号或双引号字符。
比如,source = “string s = “/* Not a comment. */”;” 不会出现在测试样例里。
此外,没有其他内容(如定义或宏)会干扰注释。
我们保证每一个块注释最终都会被闭合, 所以在行或块注释之外的/*总是开始新的注释。
最后,隐式换行符可以通过块注释删除。 有关详细信息,请参阅下面的示例。
从源代码中删除注释后,需要以相同的格式返回源代码。
示例 1:
输入: source = ["/*Test program */", "int main()", "{ ", " // variable declaration ", "int a, b, c;", "/* This is a test", " multiline ", " comment for ", " testing */", "a = b + c;", "}"]
输出: ["int main()","{ "," ","int a, b, c;","a = b + c;","}"]
解释: 示例代码可以编排成这样:
/*Test program */
int main()
{
// variable declaration
int a, b, c;
/* This is a test
multiline
comment for
testing */
a = b + c;
}
第 1 行和第 6-9 行的字符串 /* 表示块注释。第 4 行的字符串 // 表示行注释。
编排后:
int main()
{
int a, b, c;
a = b + c;
}
示例 2:
输入: source = ["a/*comment", "line", "more_comment*/b"]
输出: ["ab"]
解释: 原始的 source 字符串是 "a/*comment\nline\nmore_comment*/b", 其中我们用粗体显示了换行符。删除注释后,隐含的换行符被删除,留下字符串 "ab" 用换行符分隔成数组时就是 ["ab"].
提示:
1 <= source.length <= 100
0 <= source[i].length <= 80
source[i] 由可打印的 ASCII 字符组成。
每个块注释都会被闭合。
给定的源码中不会有单引号、双引号或其他控制字符。
解题思路
思路:既然我们需要按行删除注释并返回源代码,那么一个字符只有两种情况,要么在注释中,要么不在注释中,此时我们使用一个布尔变量in_block标志当前字符是否在注释中。当in_block为F,此时分为三种情况:第一种是/*,这时我们需要将in_block设置为T,并从/*后面的第一个字符开始查找;第二种是//,这时我们需要直接break跳过后续字符;第三种是其他情况,我们则收录当前字符。当in_block为T,此时表明前面找到/*,这时我们需要找到*/,然后找到后再将in_block设为F。
class Solution {
public:
vector<string> removeComments(vector<string>& source) {
vector<string> res;
string new_line="";
bool in_block=false;
for(auto &line:source)
{
int n=line.size();
for(int i=0;i<n;i++)
{
// 在注释块 /* 等*/
if(in_block)
{
// 设置完后继续遍历后续内容 */后面可能有//
if(i+1<n&&line[i]=='*'&&line[i+1]=='/')
{
in_block=false;
i++; //后续for循环i会继续加一 即到达/*后面的第一个字符
}
}
// 不在注释块中
else{
// 注释块 接着/*后面第一个开始遍历
if(i+1<n&&line[i]=='/'&&line[i+1]=='*')
{
in_block=true;
i++; //后续for循环i会继续加一 即到达/*后面的第一个字符
}
// 注释块 跳过后面内容
else if(i+1<n&&line[i]=='/'&&line[i+1]=='/')
break;
// 该字符不在注释块中直接加入结果
else
new_line+=line[i];
}
}
// start&&end使得in_block变为false而flag不会改变in_block
if(!in_block&&new_line!="")
{
res.push_back(new_line);
new_line="";
}
}
return res;
}
};
总结:这种按照字符是否在注释中设置标志变量就十分巧妙!!!
原来思路:一开始我的思路是,对于每一个字符串,设置start表示/*是否找到,设置end表示*/是否找到,设置flag表示//是否找到,然后设置双指针l和r,其中l从左向右找/*或者//,并且两者不能交叉,r从右向左找*/,并且不能与/*有重叠,最后处理收录部分,这样反而还出错了。因为有可能一个字符串中同时包含*/和*//,那么从右向左找就会出错。(血泪教训,还是老老实实遍历吧)
class Solution {
public:
vector<string> removeComments(vector<string>& source) {
// ["a/*/b//*c","blank","d/*/e*//f"] 猝死在这里
// 问题在于我最后找到*/就完了
// 但实际上是d/*/的*/ 和//f的//
vector<string> res;
int n=source.size();
string subs="";
bool flag=false;
bool start=false;
bool end=false;
for(int i=0;i<n;i++)
{
int m=source[i].size();
int l=0,r=m-1;
while(l<r)
{
// 左边开始找//找到就截取前面部分
// 同时防止与第一个交叉防止交叉
if(source[i][l]=='/'&&source[i][l+1]=='/'&&!start&&!flag)
{
subs+=source[i].substr(0,l);
flag=true;
break;
}
// 左边开始找/*找到就截取前面部分
if(source[i][l]=='/'&&source[i][l+1]=='*'&&!start)
{
subs+=source[i].substr(0,l);
start=true;
}
// 控制一下 start为假才加一 否则不动 让end开始查找
// 避免" */ return 0;"这种end被start跳过了
else if(!start)
l++;
// 右边开始找*/找到就截取后面部分
// r-l>=3控制左右不重复
if(source[i][r]=='/'&&source[i][r-1]=='*'&&r-l>=3&&!end)
{
subs+=r==m-1?"":source[i].substr(r+1);
end=true;
}
else
r--;
}
if(start||end||flag)
{
if(start&&end)
{
if(subs!="")
{
int ll=subs.size();
// 清空*/ 后续的//后面的内容
for(int k=0;k+1<ll;k++)
{
if(subs[k]=='/'&&subs[k+1]=='/')
{
subs=subs.substr(0,k);
break;
}
}
res.push_back(subs);
}
start=false;
end=false;
subs="";
}
else if(flag)
{
if(subs!="")
res.push_back(subs);
flag=false;
subs="";
}
// start没有但是有end
// ["void func(int k) {", "// this function does nothing /*", " k = k*2/4;", " k = k/2;*/", "}"]
else if(!start&&end)
{
res.push_back(source[i]);
start=false;
end=false;
subs="";
}
}
else
res.push_back(source[i]);
}
return res;
}
};