使用停用词
stopword_list = get_stopword_list() # 获取停用词表
filter_list = [] # 保存过滤后的结果
for seg in seg_list:
word = seg # 单词
# 过滤停用词表中的词,以及长度为<2的词
if not word in stopword_list and len(word) > 1:
filter_list.append(word)
2021-07-09
最新推荐文章于 2021-12-20 21:15:28 发布