Week7-5Statistical POS tagging

最新推荐文章于 2020-05-14 21:41:39 发布

zypandora

最新推荐文章于 2020-05-14 21:41:39 发布

阅读量254

点赞数

分类专栏： NLP(Michigan)

本文链接：https://blog.csdn.net/zypandora/article/details/50459007

版权

NLP(Michigan) 专栏收录该内容

45 篇文章 0 订阅

订阅专栏

POS tagging methods

rule-based
stochastic
- HMM(generative)
- Maximum Entropy(discriminative)
transfer-based

HMM tagging

T = arg max P (T ∣ W) P (T ∣ W) = P ( W ∣ T ) P ( T ) P ( W )

$T = \arg \max P(T \mid W)\\ P(T \mid W ) = \frac{P(W \mid T) P(T)}{P(W)}$

$P(W)$ is ignored, and $P(T)$ is called prior, and $P(W \mid T)$ is likelihood.

P (T) P (W ∣ T) = P (t 1, t 2, . . ., t n) P (w 1, w 2, . . ., w n ∣ t 1, t 2, . . . t n) = \prod i n p (t i ∣ t 1, . . ., t i - 1) \prod i n p (w i ∣ w 1, . . ., w i - 1, t 1, t 2, . . ., t i)

$\begin{align} P(T) P(W \mid T) &= P(t_1, t_2, ..., t_n) P(w_1, w_2, ..., w_n \mid t_1, t_2, ... t_n)\\ &= \prod_{i}^n p(t_i \mid t_1, ..., t_{i-1}) \prod_i^n p(w_i \mid w_1, ..., w_{i-1}, t_1, t_2, ..., t_i) \end{align}$

Simplification 1
- $P(W \mid T) = \prod P(w_i \mid t_i)$
  -Simplification 2
- $P(T) = \prod P(t_i \mid t_{i-1})$
Bigram approximation
- $T = \arg \max P(T \mid W) = \prod P(w_i \mid t_i) P(t_i \mid t_{i-1})$

Evaluating taggers

Data set
- Training set
- Development set
- Test set
Tagging accuracy

Transformation-based learning

Thoughts about POS taggers

New domains
- Lower performance
Distributional Clustering

这里写图片描述

zypandora

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
Week7-5Statistical POS tagging

POS tagging methodsrule-basedstochastic HMM(generative)Maximum Entropy(discriminative)transfer-basedHMM taggingT=argmaxP(T∣W)P(T∣W)=P(W∣T)P(T)P(W)T = \arg \max P(T \mid W)\\P(T \mid W ) = \frac
复制链接

扫一扫