敏感词过滤(非正则表达式)疫苗,疫情(简单易懂,代码可以直接运行)
我们国家新冠病毒疫苗接种的基本原则是“知情、同意、自愿”。接种人群的数量和群众接种意愿是直接相关的,所以在接种工作过程中我们一直在关注这个问题,也是接种工作的重点。我们一直在跟踪研究这个问题,根据现在了解的情况看,接种意愿受到的影响因素比较多,接种意愿变化也比较大。当前看,影响接种意愿的有两个主要因素:第一是疫情防控因素,我们国家目前采取了有力得当的疫情防控措施,所以我国的疫情总体平稳,部分群众就认为感染风险比较低,暂时不需要接种疫苗来增加保护力;第二是由于新冠病毒疫苗属于新上市疫苗,部分群众希望能够看到更多关于疫苗使用效果的信息,大家非常关注安全性、有效性等方面的数据,大家考虑对疫苗有更多了解之后再接种。当前主要是这两个方面因素有较大影响作用。
过滤敏感词:疫苗,疫情
直接利用字符串自带的内置函数replace即可完成替换,因为疫情,疫苗是两个关键词,所以要使用两次replace
点个免费的👍吧,代码如下:
#coding=utf-8
#在第一行加入一行#coding = utf-8
import re
import requests
#完成实战任务一:敏感词过滤
content = "我们国家新冠病毒疫苗接种的基本原则是“知情、同意、自愿”。接种人群的数量和群众接种意愿是直接相关的,所以在接种工作过程中我们一直在关注这个问题,也是接种工作的重点。我们一直在跟踪研究这个问题,根据现在了解的情况看,接种意愿受到的影响因素比较多,接种意愿变化也比较大。当前看,影响接种意愿的有两个主要因素:第一是疫情防控因素,我们国家目前采取了有力得当的疫情防控措施,所以我国的疫情总体平稳,部分群众就认为感染风险比较低,暂时不需要接种疫苗来增加保护力;第二是由于新冠病毒疫苗属于新上市疫苗,部分群众希望能够看到更多关于疫苗使用效果的信息,大家非常关注安全性、有效性等方面的数据,大家考虑对疫苗有更多了解之后再接种。当前主要是这两个方面因素有较大影响作用。"
#将敏感词替换为**疫苗疫情
#建立正则表达式
word = re.findall(r'疫情|疫苗',content,re.S)
# word = re.findall(r'疫情',content,re.S)
# word1 = re.findall(r'疫苗',content,re.S)
# content = content.replace('疫情','*')
print(word)#这段信息中共有多少个敏感词
print(content.replace('疫情','**').replace('疫苗','**'))
需要注意必须在代码的第一行加上:
#coding=utf-8
这句代码,否则代码将会报错!!!!!!!