新手探索NLP（十五）——终章

最新推荐文章于 2024-09-09 09:06:20 发布

野营者007

最新推荐文章于 2024-09-09 09:06:20 发布

阅读量352

点赞数

分类专栏： Neural Network 文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_40136685/article/details/90668518

版权

本文深入探讨NLP，从中文语音处理、未登录词识别，到概率图模型如信息熵、互信息，再到统计语言模型、HMM、最大熵模型和条件随机场。接着，介绍词性、语块和命名实体识别，以及句法理论和自动分析，最后触碰NLP中的深度学习，聚焦LSMT模型。

摘要由CSDN通过智能技术生成

目录

中文语音的机器处理

汉语语言学的研究

未登录词识别

概率图模型

统计语言模型

隐马尔科夫模型

最大熵模型

最大熵原理

条件随机场模型

线性链条件随机场

不同模型的比较与总结

词性、语块和命名实体识别

命名实体识别

句法理论和自动分析

PCFG短语结构

NLP中的深度学习

信息的筛选

新信息的存放

中文语音的机器处理

交集型切分歧义：汉字串AJB满足AJ、JB同时为词，此时J称为交集串。

组合型切分歧义：汉字串AB满足A、B、AB同时为词。

规律：一个词汇的出现于其上下文环境中出现的词汇序列存在紧密的关系。

文本中第n个词的出现于其前后n-m到n+m个词有高度相关性，我们把[-m,m]称为窗口范围。

汉语语言学的研究

未登录词识别

大约九成是专有名词，其余为通用新词和专业术语。

在NLP研究中，通常将专有名词和数字、日期等称为命名实体。

概率图模型

信息熵

对平均不确定性的度量。约定0log(1/0) = 0。一般而言，log以2为底，熵的单位是比特。

H(X)>=0
H(X)<=log|X|，当且仅当X的所有取值x有P(X=x) = 1/|X|等号成立。

互信息

联合熵

借助联合概率分布对熵的自然推广。

条件熵

利用条件概率分布对熵的延伸。

两个随机变量相互独立 <=> 两者互信息为0.

两种模型的区别和联系

统计语言模型

计算句子中某种语言模式出现概率的统计模型。

实际应用中一般取用n=3的三元模型。

隐马尔科夫模型

缺点：随着矩阵的增大，计算量将急剧增大。

Viterbi算法

最大熵模型

一个单独的词可以用k种词性，所有词性出现的概率总和需为1。按照最大熵原理，在没有任何约束条件的情况下，尽可能将概率均匀地分配。也可以引入

最低0.47元/天解锁文章

关注

0
点赞
踩
4

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。