BUAA-2021春-数据结构-综合作业-文本摘要生成(Hash实现 + SIMD优化 终测最速)
题目内容
问题描述
在自然语言文本处理中,有一种分析文本、自动抽取文本主题思想的方法(通常用于文本摘要生成),其方法如下:
1.首先分析文本中非停用词(stop-word)的出现频度;
2.统计文本中每个句子中非停用词频度之和。若某个非停用词在一个句子中出现多次,则都要计算;
3.按非停用词频度之和由高至低输出前N个句子。
注:
l单词为仅由字母组成的字符序列。包含大写字母的单词应将大写字母转换为小写字母后进行词频统计。
l句子是由下...
原创
2021-08-07 19:44:50 ·
2844 阅读 ·
4 评论