标题自然语言处理综合大笔记

还需要查的关键词

文本生成,文本摘要,句子压缩与融合,文本复述,远程监督Distant Supervison,随机游走Random walk,马尔科夫逻辑Markov logic,Beam search,基于深层语法的文本生成,线图分析法(Chart Parsing)技术,基于同步文法的文本生成。

语法理论

语法分析

组合范畴语法(Combinatory Categorial Grammar;简称 CCG)

中心语驱动的短语结构语法(Head-driven Phrase-Structure Grammar;简称 HPSG)。

上下文无关文法(Context-Free Grammar;简称 CFG)

关键词提取

分类

  1. 有监督
    关键词抽取算法看作是二分类问题。
  2. 半监督
    只需要少量的训练数据,利用这些训练数据构建关键词抽取模型,然后使用模型对新的文本进行关键词提取,对于这些关键词进行人工过滤,将过滤得到的关键词加入训练集,重新训练模型。
  3. 无监督

算法

基于统计学

  1. 词权重
    基于词权重的特征量化主要包括词性、词频、逆向文档频率、相对词频、词长等。
  2. 词的文档位置
    这种特征量化方式是根据文
  • 0
    点赞
  • 3
    收藏
    觉得还不错? 一键收藏
  • 1
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论 1
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值