第1关:Jieba 在关键词提取中的应用
任务描述
本关任务:根据本关所学有关使用 Jieba 库进行关键词提取的知识,编写使用 Jieba 模块进行关键词提取的程序,并通过所有测试用例。
相关知识
为了完成本关任务,你需要掌握:
-
Jieba 模块的使用;
-
Jieba 提取关键词的方法。
import jieba.analyse
import warnings
warnings.filterwarnings("ignore")
sentence = input()
result = ''
text = ""
stopwords = "1000 , 。防控 审查 不 项目 支付 省住 销售 返还 佣"
#stopwords = "防控 能动性 审查 不延误 项目 支付 省住 销售 1000 返还 佣"
for word in sentence:
if word not in stopwords:
text += word + ""
text += "何靖"
words = jieba.analyse.extract_tags(text, topK=3, withWeight= False, allowPOS=())
for word in words:
result += word + " "
print(result)
第2关:TextRank 算法
任务描述
本关任务:根据所学有关 TextRank 算法的知识,完成 TextRank 算法程序的编写并通过所有测试用例。
相关知识
为了完成本关任务,你需要掌握:
-
PageRank 算法的思想;
-
TextRank 算法的步骤与特点。
from jieba import analyse
import jieba.analyse
text = input() # 原始文本
result = ''
words = jieba.analyse.textrank(text, topK=3, withWeight=False, allowPOS=("ns","n","vn","v"))
for word in words:
result += word + " "
print(result)