敏感词保存在txt文件中,当用户输入敏感词语,则用 星号 * 替换,例如当用户输入「北京是个好城市」,则变成「**是个好城市」。
思路整理:
#1.获取敏感词文件,读取文件,将文件放入列表
#2.获取用户输入
#3.检查用户输入,是否有敏感词语,
#4.若是输入中有敏感词语,将敏感词用同等长度的**替换
#5.若是输入中没有敏感词,则直接输出
file_path='C:/workspace/VS Code training/test6-Sensitive_word_detection/filtered_words.txt'
#1.获取敏感词文件,读取文件,将文件放入列表
with open(file_path,'r',encoding='utf-8') as fr:
frrd=str(fr.readlines())
#print(frrd)
#2.获取用户输入
users_input=input('Pls input:')
#3.检查用户输入,是否有敏感词语
for i in frrd:
if i in users_input:
#4.若是输入中有敏感词语,将敏感词用同等长度的**替换
users_input=users_input.replace(i,'*'*len(i))
print(users_input)
else:
#6.若是输入中没有敏感词,则直接输出
print(users_input)
在上述代码中,可以完成敏感词过滤的任务,但是,输出的结果是这样的:
>>>Pls input:是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务员
是一名公务*
是一名公务*
是一名公务*
是一名公务*
是一名公务*
是一名公务*
是一名公务*
是一名*务*
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
是一名***
重复了很多次,我也不知道是为什么?