Python开发练习-对比三种jieba分词的关键词提取结果

最新推荐文章于 2024-07-22 22:15:00 发布

tocreateone

最新推荐文章于 2024-07-22 22:15:00 发布

阅读量2.3k

点赞数

分类专栏： Python 文章标签： python 自然语言处理

本文链接：https://blog.csdn.net/tocreateone/article/details/113942494

版权

本文探讨了jieba分词库在关键词提取方面的应用，指出不同提取方法产生的结果差异，并提到可以通过优化提高效率。同时，提供Python学习资源及小任务处理服务。

摘要由CSDN通过智能技术生成

jieba分词是一个很不错的中文分词库，其中关键词提取常用，不同的提取方式结果略有不同，关键词提取优化还是可以做一下的。

import os
import pathlib
import jieba
import jieba.analyse
from collections import Counter

def getfile():
    #获取当前子目录wenzhang1下的所有txt文档
    filetp=''
    targcwd=os.path.join(os.getcwd(),'wenzhang1')
    filelist=list(sorted(pathlib.Path(targcwd).glob('*.txt')))
    filetp=[str(tp)