//盗墓者是个丑奴儿,原
做了这个练习,发现c语言不擅长做中文字校对,本博文是匹配c中,中文字占3字节,每一个汉字的3字节中每一个字节是否与敏感字符的每一个字节相等。
#include <stdio.h>
#include <stdlib.h>
#include <string.h>
#include <time.h>
int main(void){
//要检查的字符串
char * str="sadassa色情asdfsdf,sadfasd赌博,sadfsadfsadf";
//敏感字符串数组
char * sen[]={"色情","赌博"};
char arr[strlen(str)];
int size=sizeof(sen)/sizeof(char *);
//将字符串每一个字符放入数组中
for(int i=0;i<strlen(str);i++){
//观察到逗号的数值分别是:-17,-68,-116,且推测出中文字符/汉字在c中占3字节
if(str[i]==-17){
arr[i]=',';
}else if(str[i]==-68 || str[i]==116){
arr[i]=' ';
}else{
arr[i]=str[i];
}
}
//循环将字符串与敏感字符串数组中的字符,一一匹配,如果有匹配则敏感字符化*处理
for(int i=0;i<strlen(arr);i++){
for(int j=0;j<size;j++){
for(int y=0;y<strlen(sen[j]);y++){
if(arr[i]==(sen[j])[y]){
arr[i]='*';}
}
}
}
printf("%s \n",arr);
return 0;
}
运行结果: