L1-101 别再来这么多猫娘了！(C++)

智创者

于 2024-09-21 21:58:52 发布

阅读量799

点赞数 22

文章标签： c++

本文链接：https://blog.csdn.net/2301_80278321/article/details/142424756

版权

L1-101 别再来这么多猫娘了！

以 GPT 技术为核心的人工智能系统出现后迅速引领了行业的变革，不仅用于大量的语言工作（如邮件编写或文章生成等工作），还被应用在一些较特殊的领域——例如去年就有同学尝试使用 ChatGPT 作弊并被当场逮捕（全校被取消成绩）。相信聪明的你一定不会犯一样的错误！

言归正传，对于 GPT 类的 AI，一个使用方式受到不少年轻用户的欢迎——将 AI 变成猫娘：

部分公司使用 AI 进行网络营销，网友同样乐于使用“变猫娘”的方式进行反击。注意：图中内容与题目无关，如无法看到图片不影响解题。

当然，由于训练数据里并不区分道德或伦理倾向，因此如果不加审查，AI 会生成大量的、不一定符合社会公序良俗的内容。尽管关于这个问题仍有争论，但至少在比赛中，我们还是期望 AI 能用于对人类更有帮助的方向上，少来一点猫娘。

因此你的工作是实现一个审查内容的代码，用于对 AI 生成的内容的初步审定。更具体地说，你会得到一段由大小写字母、数字、空格及 ASCII 码范围内的标点符号的文字，以及若干个违禁词以及警告阈值，你需要首先检查内容里有多少违禁词，如果少于阈值个，则简单地将违禁词替换为<censored>；如果大于等于阈值个，则直接输出一段警告并输出有几个违禁词。

输入格式:

输入第一行是一个正整数 N (1≤N≤100)，表示违禁词的数量。接下来的 N 行，每行一个长度不超过 10 的、只包含大小写字母、数字及 ASCII 码范围内的标点符号的单词，表示应当屏蔽的违禁词。
然后的一行是一个非负整数 k (0≤k≤100)，表示违禁词的阈值。
最后是一行不超过 5000 个字符的字符串，表示需要检查的文字。
从左到右处理文本，违禁词则按照输入顺序依次处理；对于有重叠的情况，无论计数还是替换，查找完成后从违禁词末尾继续处理。

输出格式:

如果违禁词数量小于阈值，则输出替换后的文本；否则先输出一行一个数字，表示违禁词的数量，然后输出He Xie Ni Quan Jia!。

输入样例1:

5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
4
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.

输出样例1:

BianCheng <censored> ba! <censored> De Hua Ye Keyi Shuo! BuYao <censored> NeiRong.

输入样例2:

5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
3
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.

输出样例2:

3
He Xie Ni Quan Jia!

输入样例3:

2
AA
BB
3
AAABBB

输出样例3:

<censored>A<censored>B

输入样例4:

2
AB
BB
3
AAABBB

输出样例4:

AA<censored><censored>

输入样例5:

2
BB
AB
3
AAABBB

输出样例5:

AAA<censored>B

一.解题思路：

第1步.

初步审题后可以得到一个简单的思路便是存储每一个违禁词（可以存放在字符串数组中），在文本中依次寻找每一个违禁词，最后根据违禁词个数与阈值的比较分出两种情况，一种是替换违禁词，另一种是输出一句话。

第2步.

看似思路很简单，其中却暗藏玄机，依照第一种思路会发现样例5无法通过，甚至会报访问越界的错误，这是什么原因呢？仔细观察样例5的结果会发现，文本中发现BB后直接被替换为了<censored>此时AB被破坏了，不存在AB了，所以违禁词只有BB一个，此时按照上述的在文本中寻找每一个违禁词再依次替换的方法就不奏效了，因为原本的第二个违禁词已经被破坏了。此时我们应该转换思路为发现违禁词就替换，这样第二个违禁词就不会被找到了。

第3步.

隐含条件：

按照样例的引导，很容易忽略一个隐藏的条件，那就是题目中并未表明文本中每一种违禁词只出现一次，可能同一种违禁词出现多次，此时需要注意c++ 的find函数只能找到第一次出现的违禁词，无法找到后面的，导致查找遗漏，可以采用如下方法：将找到的违禁词替换为我们自定义的符号，这样原本的第一个违禁词不存在，自动寻找第二个违禁词。在代码实现时每一种违禁词用while循环全部找到后再找下一个词。

二.注意事项

本题有一个注意事项，可能导致思路正确的代码出现问题

1.在输入n以及k之后涉及到循环输入，要在输入n和k之后吸收回车符用C语言的getchar() 或 C++的 cin.ignore()

三.代码实现

#include <iostream>
#include <string>
using namespace std;
int main()
{
    int n;
    cin >> n;
    cin.ignore();//吸收回车符
    string s[n];//存违禁词
    for(int i=0;i<n;i++)
    {
        cin >> s[i];
    }
    int k;
    cin >> k;
    string str;//存文本
    cin.ignore();//吸收回车符
    getline(cin,str);//输入文本 有空格 所有用getline输入
    int cnt=0;//记录违禁词个数
    for(int j=0;j<n;j++)//n个违禁词
    {
        while((int)str.find(s[j]) != -1)//文本中相同违禁词可能有多个 用循环查找
        //find函数返回无符号整型 强制转换为int 才可以与-1比较 或者写为while(str.find(s[j]) != str.npos)
        { 
            int pos = (int)str.find(s[j]);//违禁词首字母的位置
            int len = s[j].length();//违禁词的长度
            str.replace(pos,len,"-_-");//违禁词替换为任意字符
            cnt++;//记录个数
        }
    }
    if(cnt<k)
    {
        //while循环或for循环均可
        // while((int)str.find("-_-") != -1) 或 
        for(int i=0;i<cnt;i++)
        {
            int pos = str.find("-_-");
            str.replace(pos,3,"<censored>");
        }
        cout << str << endl;
    }
    else
    {
        cout << cnt << endl;
        cout << "He Xie Ni Quan Jia!";
    }

    return 0;
}