Michael collins nlp课程笔记(四)MEMMS(Log-Linear Tagging Models)

目录

 

一、条件标注模型的定义

 二、Trigram MEMMs

2.1 模型定义

 2.2 参数估计

 2.3 解码

pdf链接:http://www.cs.columbia.edu/~mcollins/fall2014-loglineartaggers.pdf

一、条件标注模型的定义

 二、Trigram MEMMs

2.1 模型定义

对我们所要建模的条件概率进行分解,有:

在Trigram MEMMs中,做了一个重要的假设: 。在这个假设中,可以看到第i个tag的历史信息是

。 

接下来,基于历史信息h_i和标签y_i构造特征。特征的构造方法类似于Log-Linear中提到的一组指示函数。只是对于不同的标注问题,我们可以根据需要哪些信息来设计不同的指示函数。例如,在词性标注问题中,可以设计如下特征: 

在POS tagging problem里面,常用的特征有word/tag features,Prefix and Suffix features,Trigram,Bigram and Unigram Tag features等等。 

设计好特征后,就可以利用Log-Linear的思想得到下面的概率模型:

 整个流程可以描述为:

 2.2 参数估计

参数估计依然使用Log-Linear中极大似然估计和正则化结合的方式。

 2.3 解码

在估计完参数之后,我们的模型也就建立起来了,接下来要解决的问题是如何快速地找到\arg\max\limits_{y_1...y_n \in Y(n)} p(y_1...y_n|x_1...x_n)。利用维特比算法可以快速求解。算法如下:

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值