Python根据词根将关键词进行分类

#-*- coding: UTF-8 -*-
import jieba
jieba.initialize()
fenlei = {
           '器械' : ["二类","三类"],
           '医美' : ["医疗","备案"],
           '保安' : ["保安","服务"]
}

keyword = open('keyword.txt','r',encoding='utf-8')
keywords = [x.strip() for x in keyword]
new_k = {
            '器械': [],
            '医美': [],
            '保安': [],
            '其他': []
}
for i in keywords:
    res = jieba.lcut(i)
    for k,v in fenlei.items():
        if set(v) & set(res) :
            new_k[k].append(i)
            break
    else:
        new_k['其他'].append(i)

# f = open('keword1.txt','w',encoding='utf-8')
for k,v in new_k.items():
     with open(f'{k}', 'w', encoding='utf-8') as fd :
      fd.writelines(f'{v}\n')

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值