jieba分词是一个很不错的中文分词库,其中关键词提取常用,不同的提取方式结果略有不同,关键词提取优化还是可以做一下的。
import os
import pathlib
import jieba
import jieba.analyse
from collections import Counter
def getfile():
#获取当前子目录wenzhang1下的所有txt文档
filetp=''
targcwd=os.path.join(os.getcwd(),'wenzhang1')
filelist=list(sorted(pathlib.Path(targcwd).glob('*.txt')))
filetp=[str(tp)