Week7-5Statistical POS tagging

POS tagging methods

  • rule-based
  • stochastic
    • HMM(generative)
    • Maximum Entropy(discriminative)
  • transfer-based

HMM tagging

T=argmaxP(TW)P(TW)=P(WT)P(T)P(W)

P(W) is ignored, and P(T) is called prior, and P(WT) is likelihood.

P(T)P(WT)=P(t1,t2,...,tn)P(w1,w2,...,wnt1,t2,...tn)=inp(tit1,...,ti1)inp(wiw1,...,wi1,t1,t2,...,ti)

  • Simplification 1
    • P(WT)=P(witi)
      -Simplification 2
    • P(T)=P(titi1)
  • Bigram approximation
    • T=argmaxP(TW)=P(witi)P(titi1)

Evaluating taggers

  • Data set
    • Training set
    • Development set
    • Test set
  • Tagging accuracy

Transformation-based learning

Thoughts about POS taggers

  • New domains
    • Lower performance
  • Distributional Clustering

这里写图片描述

  • 0
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
《统计信号处理估计理论基础 - 史蒂文·凯》是一本经典的统计信号处理教材,提供了关于估计理论的基础知识,适用于信号处理领域的学习者和从业者。该书主要包括以下几个方面的内容。 首先,该书介绍了估计理论的基本概念和数学工具。它强调了使用概率论和统计学方法进行信号估计的重要性。读者将学习到如何基于数据的统计特性进行信号参数的估计,以及如何评估估计的准确性和可靠性。此外,书中还详细介绍了贝叶斯信号检测和估计方法,提供了一种基于贝叶斯框架的信号处理方法。 其次,该书还涵盖了多种常见的估计问题和算法。它介绍了最小均方误差 (MSE) 估计,包括线性最小均方误差 (LMMSE) 估计和最大似然估计 (MLE)。此外,书中还介绍了最大后验估计 (MAP) 和贝叶斯估计方法,并详细讨论了非线性估计问题。 此外,该书还讨论了一些实际应用中的特殊估计问题。例如,它涵盖了信号检测与估计中的边缘化和条件化问题,以及参数估计中的偏差-方差权衡。这些问题在信号处理和统计学中都是非常重要的,并且在实际中经常遇到。 《统计信号处理估计理论基础 - 史蒂文·凯》是一本全面而详尽的教材,适用于初学者和有经验的研究人员。它不仅提供了理论基础,还包含了大量的实例和应用说明,帮助读者更好地理解和应用估计理论。无论是学习信号处理的学生,还是从事相关研究和工作的人员,该书都是一本值得推荐的参考资料。

“相关推荐”对你有帮助么?

  • 非常没帮助
  • 没帮助
  • 一般
  • 有帮助
  • 非常有帮助
提交
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值