文章目录
还需要查的关键词
文本生成,文本摘要,句子压缩与融合,文本复述,远程监督Distant Supervison,随机游走Random walk,马尔科夫逻辑Markov logic,Beam search,基于深层语法的文本生成,线图分析法(Chart Parsing)技术,基于同步文法的文本生成。
语法理论
语法分析
组合范畴语法(Combinatory Categorial Grammar;简称 CCG)
中心语驱动的短语结构语法(Head-driven Phrase-Structure Grammar;简称 HPSG)。
上下文无关文法(Context-Free Grammar;简称 CFG)
关键词提取
分类
- 有监督
关键词抽取算法看作是二分类问题。 - 半监督
只需要少量的训练数据,利用这些训练数据构建关键词抽取模型,然后使用模型对新的文本进行关键词提取,对于这些关键词进行人工过滤,将过滤得到的关键词加入训练集,重新训练模型。 - 无监督
算法
基于统计学
- 词权重
基于词权重的特征量化主要包括词性、词频、逆向文档频率、相对词频、词长等。 - 词的文档位置
这种特征量化方式是根据文