标注问题

标注问题是分类问题的一个推广,是更复杂的结构预测问题的一个简单的形式。


输入是一个观测序列,输出是一个标记序列或者状态序列。其目的是学习一个模型,使得对于观测序列能够给出一个标记序列作为预测。注意标记个数是有限的,但其组合所成的标记序列的个数是随着序列长度成指数级增长的。


学习系统基于训练数据集构建一个模型,表示为条件概率分布.p(Y1,Y2...YN|X1,X2...XN)

每一个xi取值为所以可能的观测,每一个Yi取值为所有可能的标记。


标注系统按照学习得到的条件概率分布模型,对新的输入观测序列找到相应的输出标记序列。

对于输入的观测序列找到使条件概率最大的标记序列。


评价标记系统的指标和评价分类系统的指标一样,常用的有准确率,精确率,召回率。


标注常用的统计学习方法有:隐马尔科夫模型,条件随机场。


应用范围:信息抽取,自然语言处理。



  • 0
    点赞
  • 1
    收藏
    觉得还不错? 一键收藏
  • 0
    评论

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值