NLP—2.语言模型及文本表示

最新推荐文章于 2024-07-30 14:18:02 发布

哎呦-_-不错

最新推荐文章于 2024-07-30 14:18:02 发布

阅读量1k

点赞数 1

分类专栏： NLP学习文章标签：语言模型文本表示

本BLOG上原创文章未经本人许可，不得用于商业用途，转载请注明出处。

本文链接：https://blog.csdn.net/weixin_46649052/article/details/119349991

版权

本文深入探讨了自然语言处理中的语言模型，包括如何评价模型好坏、平滑概念及其在拼写纠错中的应用。介绍了困惑度作为评估标准，以及平滑技术如拉普拉斯平滑和插值。此外，还详细讲解了词集模型、词袋模型和Word2Vec词嵌入模型，阐述了这些模型在文本表示中的作用和优缺点。

摘要由CSDN通过智能技术生成

文章目录

一、语言模型

语言模型可以说是自然语言处理中最重要的模型。语言模型可以看做是一个函数，用于计算一个句子出现的概率，即语言模型可以判断某一句话从语法上是否通顺（是不是人话），从语义上是否有歧义。在很多时候，我们都要度量一句话的出现概率，一句话的出现概率等同于一句话语法的流畅程度。通过语言模型，我们可以知道：
$P_{LM}(今天天气真不错)>P_{LM}(真不错天气今天)\\P_{LM}(全民AI是趋势)>P_{LM}(全民趋势是AI)$
语言模型可以用于语音识别，机器翻译。
那么，如何计算每句话出现的概率？每句话出现的概率等于单词序列出现的概率。
$P_{LM}(s)=P_{LM}(w_1,w_2,...,w_n)$
根据链式法则，可以表示为
$P_{LM}(s)=P_{LM}(w_1,w_2,...,w_n)=P_{LM}(w_1)P_{LM}(w_2|w_1)...P_{LM}(w_n|w_1w_2...w_{n-1})$

最低0.47元/天解锁文章

哎呦-_-不错

关注

1
点赞
踩
3

收藏

觉得还不错? 一键收藏
0
评论
NLP—2.语言模型及文本表示

文章目录一、语言模型1. 如何评价语言模型的好坏？2. 语言模型的平滑概念3.语言模型在拼写纠错中的应用3.1 如何解决错别字错误？二、文本表示1. 词集模型—onthot编码2.词袋模型—Bag of Words3.Word2Vec—词嵌入模型一、语言模型语言模型可以说是自然语言处理中最重要的模型。语言模型可以看做是一个函数，用于计算一个句子出现的概率，即语言模型可以判断某一句话从语法上是否通顺（是不是人话），从语义上是否有歧义。在很多时候，我们都要度量一句话的出现概率，一句话的出现概率等同于一句
复制链接

扫一扫

专栏目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。