因此你的工作是实现一个审查内容的代码,用于对 AI 生成的内容的初步审定。更具体地说,你会得到一段由大小写字母、数字、空格及 ASCII 码范围内的标点符号的文字,以及若干个违禁词以及警告阈值,你需要首先检查内容里有多少违禁词,如果少于阈值个,则简单地将违禁词替换为<censored>
;如果大于等于阈值个,则直接输出一段警告并输出有几个违禁词。
输入格式:
输入第一行是一个正整数 N (1≤N≤100),表示违禁词的数量。接下来的 N 行,每行一个长度不超过 10 的、只包含大小写字母、数字及 ASCII 码范围内的标点符号的单词,表示应当屏蔽的违禁词。
然后的一行是一个非负整数 k (0≤k≤100),表示违禁词的阈值。
最后是一行不超过 5000 个字符的字符串,表示需要检查的文字。
从左到右处理文本,违禁词则按照输入顺序依次处理;对于有重叠的情况,无论计数还是替换,查找完成后从违禁词末尾继续处理。
输出格式:
如果违禁词数量小于阈值,则输出替换后的文本;否则先输出一行一个数字,表示违禁词的数量,然后输出He Xie Ni Quan Jia!
。
输入样例1:
5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
4
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.
输出样例1:
BianCheng <censored> ba! <censored> De Hua Ye Keyi Shuo! BuYao <censored> NeiRong.
输入样例2:
5
MaoNiang
SeQing
BaoLi
WeiGui
BuHeShi
3
BianCheng MaoNiang ba! WeiGui De Hua Ye Keyi Shuo! BuYao BaoLi NeiRong.
输出样例2:
3
He Xie Ni Quan Jia!
输入样例3:
2
AA
BB
3
AAABBB
输出样例3:
<censored>A<censored>B
输入样例4:
2
AB
BB
3
AAABBB
输出样例4:
AA<censored><censored>
输入样例5:
2
BB
AB
3
AAABBB
输出样例5:
AAA<censored>B
里面的测试点没有太多特殊的例子 ,在进行模式匹配时主要根据的KMP中的主串指针不回,副串指针可回,没有使用数组记录详细的数据,只用了2个变量,如果副串太长的话可能会超时,但这个副串长度已经给出,比较短
代码:
#include <stdio.h>
#include <string.h>
#include <stdlib.h>
int main()
{
char str[50001];
int n;scanf("%d\n",&n);
char cen[n][11]; //记录违禁词 要匹配主串的字符串
int collect[5000]={0}; //标志对应位置的字符串,没有违禁词一直为0
for (int i=0;i<n;i++)
scanf("%s\n",cen[i]);
int threshold;scanf("%d\n",&threshold); //最后输出判断的阈值
int s=0;
while(scanf("%c",&str[s++])!=EOF); //不能用getchar()!=‘\n’每次循环会少存一个字符
int count=0; //count为违禁词出现的次数
for (int i=0;i<n;i++) //总的循环为输入违禁词的数量 由例5得按照输入违禁词的顺序进行判断
{ //里面类似KMP算法
int pattern=0,head=0,record=0,max=0; //pattern 为违禁词上的指针 head为违禁词的找之前相同的指针 record记录每次连续相同时的最大违禁词位置
for (int master=0;master<s;) //在主字符串上循环1遍 master主串的指针
{
//判断主串该位置是否已经出现过违禁词 没有的话例5不会对
if (collect[master]!=0 ) //有这一个判断不需要在对主串进行更改 之前有违禁词的位置直接跳过
{
pattern=0,head=0,max=0 ;//必须对违禁词的所有指针和计数器进行初始化
master++;
continue;
}
if( str[master] == cen[i][pattern] )
{
pattern++;master++;
if (cen[i][pattern] == cen[i][head]) //如果违禁词里有相同的
{
max++; //记录违禁词里面在该位置之前有多少个相同的
head++; //违禁词前一个指针 有相同的移动
}
else //如果出现了不同的
{
if (max >record) //把之前相同的最大值赋值给record
record = max;
if (pattern-2>=0 && str[master-2]!=cen[i][pattern-2]) //(必须要有)如果主串里与违禁词相同的前1个字符不同 初始化
{ //例 违禁词ooi 主串oooi 如果没有这个判断不会识别出违禁词 测试点里也没有这类例子
head = 0;
max=0;
record=0;
}
}
}
else //如果出现了不相同的
{
pattern = record; //违禁词的指针回到记录之前相同的最大位置
while (pattern!=0 && str[master] != cen[i][pattern] ) //如果还是不相等 违禁词的指针一直向后移动进行判断直到相同(是否可以直接回到开头?)
pattern--;
if (!pattern && str[master] != cen[i][pattern]) //如果违禁词指针到头了还是不等 只能移动主串的指针了 否则会无限循环
master++;
}
//判断主串是否有违禁词
if (cen[i][pattern] == '\0') //违禁词的指针达到了尾端说明主串里有违禁词
{
count++;
for (int j=master-pattern+1;j<master;j++)// 有违禁词那么记录对应的位置和起始出现字符的位置
{
collect[j]=1; //用于最后输出
//str[j] = '+'; 有第一个判断不需要再进行更新 这个还要碰运气试测试里没有违禁词里出现过的字符
}
collect[master-pattern]=2; //起始出现违禁词的位置标志为2
//str[master-pattern]='+'; //对应的字符串要选一个不常用的测试点没有的字符替换 防止与违禁词的字符重复
pattern=0; //在记录位置的下面初始化
max=0,record=0,head=0;
}
}
}
//输出
if (count>=threshold)
printf("%d\nHe Xie Ni Quan Jia!",count);
else
{
for (int i=0;i<strlen(str);i++)
{
if (!collect[i])
printf("%c",str[i]);
else if(collect[i]==2)
printf("<censored>");
}
}
}