关于敏感词汇通过Excel导入进本地数据库

1.首先准备好我们的敏感词库!

 ①可以发现有的词库是.txt的! 这也没关系,我们也可以把它导进Excel中处理!

注意:有的是排序好的  直接复制进去就可以了!

②像这种的词汇之间带有符号的 交给Excel解决!

 

<1>数据 ——> 导入数据    下一步  选择要导入的

 

<2>这里要选择第一项    其他不变  下一步即可

 

<3>这里选择其他   因为我的是  |       所以放进去就可以   然后点击下一步    完成即可

<4>这时候发现数据在一横行   别担心  没关系!

 

<5>我们首先选择这一行 进行复制   然后在第一列的左侧添加一列      在添加列中

右键  选择性粘贴——> 粘贴内容转置

 

 2.我们尽量在第一行设置字段与数据库字段相匹配!

 

3.然后数据库操作   导入  选 Excel文件

 

①选择词库的Excel   选择需要导入的Sheet  然后下一步

 

②其他位置不变  这里适合Excel数据行相对应  然后下一步

 ③因为提前创建好了表  就不用勾选了 下一步即可

 ④可以看到Excel字段与数据库相匹配(不一样或者不匹配也没关系  可以到进来就可以)

⑤可以看到数据就进来了  如果数据过多  建议Excel整理好后  放在一个Sheet中   直接导进来就好! 

最后一点:

 想要我整理的词库 或者有不明白的地方  可以关注我  直接和我私信就可以

  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
基于Python的爬虫可以用来爬取网页上的数据,并对数据行处理和分析。关于爬虫敏感词汇,可以通过以下步骤实现: 1. 首先,导入所需的库。在这个例子,我们需要导入requests、re和json库。 2. 创建一个文本文件,将敏感词汇逐行放置在文件。该文件可以命名为word.txt,并与爬虫脚本放置在同一目录下。 3. 接下来,我们需要使用Python的requests库发送HTTP请求,并获取网页的内容。可以使用如下代码获取网页内容:response = urllib2.urlopen(urllib2.Request(url, headers=Headers))。其,url是要爬取的网址,Headers是请求头信息。 4. 使用正则表达式或其他方法对网页内容行处理,筛选出包含敏感词汇的部分。可以使用re库来实现正则表达式的匹配。根据你的具体需求,可以选择不同的正则表达式模式来匹配敏感词汇。例如,可以使用re.findall()函数来找到网页的所有匹配项。 5. 最后,可以将匹配到的敏感词汇保存到一个列表或其他数据结构,以便后续处理或输出。可以使用Python的json库将数据转换为JSON格式,以方便存储和处理。 通过以上步骤,你就可以在基于Python的爬虫实现对敏感词汇的处理和筛选。这样可以帮助你监测网页内容是否包含敏感信息,从而行相应的处理或分析。<span class="em">1</span><span class="em">2</span><span class="em">3</span><span class="em">4</span>
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值