NLP Coursera By Michael Collins - Week1

最新推荐文章于 2021-03-18 20:36:17 发布

茅坤宝骏氹

最新推荐文章于 2021-03-18 20:36:17 发布

阅读量547

点赞数

分类专栏： AI.自然语言处理

AI.自然语言处理专栏收录该内容

21 篇文章 0 订阅

订阅专栏

转载自 NLP Coursera By Michael Collins - Week1

NLP Coursera By Michael Collins - Week1

构建模型框架 - Markov Process

毕竟是机器学习嘛，所以第一步，先要把实际问题转化成数学模型。

在NLP中，一般使用的都是概率模型，即把语言模型变成概率论范畴。

比如说，现在有一段语音，说的很含糊，没有听清楚，好像是“like your”，又好像是“lie cured”。

那么到底是哪一种呢？我们就看在现有的语料库中，到底是“like your”出现的概率大，还是“lie cured”的概率大。

于是就把语音识别问题转变成了一个概率问题：输入一串字符，输出这串字符组合在一起的概率，如果概率大，就是正确的句子。

下面构建这个模型

至此，模型框架搭建完毕，但是参数还没有设定好。

也就是说，现在如果向模型中随便输入一个句子，要求输出的结果是这个句子出现的概率。

那么我们就需要事先知道模型中，每一个p(w|u,v)。

用如下方式来计算：

对于上面的计算方法，不能解决出现概率为0，但实际这句句子是合理的情况。

下面介绍两种方法，来对上面的计算方法进行改进：

第一种是Linear Interpolation：

这里的三个系数用下面的方法进行选择：

其实这个方法就是将三种计算概率的方式线性结合起来，具体的结合方式有很多种，上面只是其中一种。

上面这个方法中的三个系数和概率本身没有关系，但是更好的方法是让他们有关系：

bucketing法：对不同范围内的counts，使用不同的系数

将三个系数都写成同一个参数的线性组合：

第二种是Discounting Method:

这个方式就是，从概率不为0的情况中分出一部分的概率给概率为0的情况。

至此为止，整个模型搭建完毕。

评价模型

一般情况下：

当服从均匀分布的时候：

以上就是这一周的课程中讲的内容。notes中的内容和这个一样，基本没有什么补充。

下面用一张流程图来总结一下整个模型的构建过程。

茅坤宝骏氹

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。