Python根据词根将关键词进行分类

#-*- coding: UTF-8 -*-
import jieba
jieba.initialize()
fenlei = {
           '器械' : ["二类","三类"],
           '医美' : ["医疗","备案"],
           '保安' : ["保安","服务"]
}

keyword = open('keyword.txt','r',encoding='utf-8')
keywords = [x.strip() for x in keyword]
new_k = {
            '器械': [],
            '医美': [],
            '保安': [],
            '其他': []
}
for i in keywords:
    res = jieba.lcut(i)
    for k,v in fenlei.items():
        if set(v) & set(res) :
            new_k[k].append(i)
            break
    else:
        new_k['其他'].append(i)

# f = open('keword1.txt','w',encoding='utf-8')
for k,v in new_k.items():
     with open(f'{k}', 'w', encoding='utf-8') as fd :
      fd.writelines(f'{v}\n')

 

  • 1
    点赞
  • 12
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
Python 是一种流行的编程语言,可以用来进行关键词问答系统的开发和实现。 首先,关键词问答系统需要准备一些问答对的数据集。数据集可以包含一系列的问题和对应的答案。例如,我们可以准备一个包含多个问答对的文本文件。 然后,使用 Python 的自然语言处理(NLP)工具,比如NLTK或Spacy,对数据集进行预处理。预处理的过程包括分词、词性标注和句法分析等步骤,以便更好地理解问题的语义。 接下来,可以使用基于关键词匹配的方法来回答问题。首先,将问题进行分词,并提取出其中的关键词。然后,对于每个问题的关键词,遍历整个数据集,寻找与关键词最相似的答案。可以使用词汇相似度计算方法,比如余弦相似度或编辑距离等,来度量关键词和数据集中问题的相似度。 另一种方法是使用机器学习技术来问答。可以使用Python中的机器学习库,比如Scikit-learn或TensorFlow,来训练一个模型。可以将关键词作为特征,将问题的答案作为标签,然后通过训练模型来学习关键词和答案之间的关联。一旦模型训练完成,就可以使用模型来预测新问题的答案。 最后,可以使用Python的Web框架,比如Flask或Django,将问答系统部署为一个网络应用程序。用户可以通过输入问题的方式,从应用程序中获取答案。 总之,Python提供了丰富的工具和库,使我们可以基于关键词进行问答系统的开发和实现。无论是基于关键词匹配还是机器学习技术,都可以通过Python来实现一个功能强大的问答系统。
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值