PTA 团体程序设计天梯赛 15分题 101

L1-101 别再来这么多猫娘了!(15)

题目要求

以 GPT 技术为核心的人工智能系统出现后迅速引领了行业的变革,不仅用于大量的语言工作(如邮件编写或文章生成等工作),还被应用在一些较特殊的领域——例如去年就有同学尝试使用 ChatGPT 作弊并被当场逮捕(全校被取消成绩)。相信聪明的你一定不会犯一样的错误!

言归正传,对于 GPT 类的 AI,一个使用方式受到不少年轻用户的欢迎——将 AI 变成猫娘:

 

部分公司使用 AI 进行网络营销,网友同样乐于使用“变猫娘”的方式进行反击。注意:图中内容与题目无关,如无法看到图片不影响解题。

当然,由于训练数据里并不区分道德或伦理倾向,因此如果不加审查,AI 会生成大量的、不一定符合社会公序良俗的内容。尽管关于这个问题仍有争论,但至少在比赛中,我们还是期望 AI 能用于对人类更有帮助的方向上,少来一点猫娘。

因此你的工作是实现一个审查内容的代码,用于对 AI 生成的内容的初步审定。更具体地说,你会得到一段由大小写字母、数字、空格及 ASCII 码范围内的标点符号的文字,以及若干个违禁词以及警告阈值,你需要首先检查内容里有多少违禁词,如果少于阈值个,则简单地将违禁词替换为<censored>;如果大于等于阈值个,则直接输出一段警告并输出有几个违禁词。

输入格式

输入第一行是一个正整数 N (1≤N≤100),表示违禁词的数量。接下来的 N 行,每行一个长度不超过 10 的、只包含大小写字母、数字及 ASCII 码范围内的标点符号的单词,表示应当屏蔽的违禁词。


然后的一行是一个非负整数 k (0≤k≤100),表示违禁词的阈值。


最后是一行不超过 5000 个字符的字符串,表示需要检查的文字。


从左到右处理文本,违禁词则按照输入顺序依次处理;对于有重叠的情况,无论计数还是替换,查找完成后从违禁词末尾继续处理。

输出格式 

如果违禁词数量小于阈值,则输出替换后的文本;否则先输出一行一个数字,表示违禁词的数量,然后输出He Xie Ni Quan Jia!

分析

本题要求按照违禁词的输入顺序,对待检测文本按照从左到右顺序查找并替换。

我的思路如下:

- 用 vector<string> 存储违禁词,确保按照输入顺序处理。

- 用for(auto& element : container)语句遍历违禁词容器,确保按照输入顺序处理每个违禁词。然后内嵌套一个while循环通过 find() 函数从左到右查找对应违禁词。

- while循环中需要实现对违禁词个数计数,用count来计数,同时需要对查找到的违禁词进行替换成题给字符串"<censored>",并更新下一次查找的起始位置,避免重复查找已替换的部分

- 以上是我整个代码核心,然而程序运行后提示运行超时,时间复杂度过高,后来又尝试同时查找所给违禁词,并且替换,但是发现当先检测到后面的违禁词时,运行结果与题给不符(代码和测试结果如下)。

size_t len = sentence.length();

    //时间复杂度:O(L*N)=O(NL):只需要单次遍历字符串L,对每个位置检查所有违禁词
    //N=100,L=5000时,约操作50w次
    //无回溯,每个字符仅处理一次
    while (pos < len) {
        bool replaced = false;
        // 检查当前位置开始的子串是否是任一违禁词
        for (const auto& word : forbiddenWords) {
            if (sentence.compare(pos, word.length(), word) == 0) {
                count++;
                result += "<censored>";
                pos += word.length();
                replaced = true;
                break;
            }
        }
        //直接拼接结果字符串,避免频繁内存移动
        if (!replaced) {
            result += sentence[pos++];
        }
    }

- 经过查询发现可以先用简单的特殊字符串替换违禁词,再将特殊字符替换为题给字符串"<censored>" 。这样既可以满足从左到右,依违禁词次序查找的要求,也可以满足题目的运行时间需求,代码如下: 

代码

#include <iostream>
#include <string>
#include <vector>
using namespace std;

int main(){
         int N,k; //违禁词个数N,违禁词阈值k
         cin >> N;
         string sentence; //待检测文字
         vector<string> forbiddenWords(N); //存储违禁词,容量为N
         for(int i = 0; i < N; i++){
            cin >> forbiddenWords[i]; //读取违禁词
         }
         cin >> k; //输入阈值
         cin.ignore(); //忽略换行符
         getline(cin,sentence); //读取待检测字符串
         string result = sentence;
         int count = 0;//计违禁词个数
         //从左到右,依次检查sentence中的违禁词,并替换为其他字符串
         for(const auto& word : forbiddenWords){ 
              size_t index = 0; //初始化查询位置
              //在字符串中查找违禁词
              while((index = result.find(word,index)) != string::npos){
               //如果查到违禁词,则count加1,并且替换为其他字符串,同时更新索引
               count++;
               result.replace(index,word.length(),"*_*");
               index += 3;
              }
         }
         //如果违禁词个数少于阈值,则输出违禁词个数以及替换结果
         if(count < k){
              size_t pos = 0;
              string str = "*_*";
              while((pos = result.find(str,pos)) != string::npos){
                 //将*_*替换为<censored>
                 result.replace(pos,str.length(),"<censored>");
                 //更新查询位置
                 pos += 10;
              }
             cout << result << endl;
         }
         //如果违禁词个数大于等于阈值,则直接输出违禁词个数以及警告
         else{
            cout << count << endl;
            cout << "He Xie Ni Quan Jia!" << endl;
         }
   return 0;
}

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值