数学之美--笔记1

最新推荐文章于 2022-12-28 20:33:18 发布

尚能饭否

最新推荐文章于 2022-12-28 20:33:18 发布

阅读量669

点赞数

分类专栏：自然语言处理文章标签：数学自然语言

本文链接：https://blog.csdn.net/shangwei1991/article/details/45369901

版权

自然语言处理专栏收录该内容

2 篇文章 0 订阅

订阅专栏

1.统计语言模型

一阶马尔科夫假设：p(s)=p(w1)p(w2|w1)p(w3|w2)...p(wn|wn-1)，p(wi|wi-1)=p(wi,wi-1)/p(wi-1)。基于条件概率的二元统计语言模型，该模型太过简化，认为一个词的出现只与其前面的一个词相关。

N-1阶马尔科夫假设：p(wi|w1,w2,w3,...,wi-1)=p(w1|wi-n+1,wi-n+2,...,wi-1)。基于条件概率的N元统计语言模型。

由于指数级别的时间复杂度、空间复杂度和高阶的实际效果提升不大，实际应用中最多的是三元模型。

马尔科夫假设的局限性：由于自然语言中上下文之间的相关性可能跨度非常大，再高阶的模型也无可奈何，所以可采用长程的依赖性(long distance dependency)来解决。

由于零概率问题，模型的训练需要通过平滑方法来解决。

采用统计语言模型来进行中文分词效果要普遍高于人工分词。主要注重分词的粒度和分词的一致性。

2.隐含马尔科夫模型

马尔科夫链

隐马尔科夫链

确定要放弃本次机会？

福利倒计时

: :

立减 ¥

普通VIP年卡可用

立即使用

尚能饭否

关注关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
复制链接

分享到 QQ

分享到新浪微博

扫一扫

专栏目录

数学之美番外篇：平凡而又神奇的贝叶斯方法（转自刘未鹏）

dgglx的专栏

11-02

5373

概率论只不过是把常识用数学公式表达了出来。——拉普拉斯记得读本科的时候，最喜欢到城里的计算机书店里面去闲逛，一逛就是好几个小时；有一次，在书店看到一本书，名叫贝叶斯方法。当时数学系的课程还没有学到概率统计。我心想，一个方法能够专门写出一本书来，肯定很牛逼。后来，我发现当初的那个朴素归纳推理成立了——这果然是个牛逼的方法。——题记目录0. 前言 1. 历史 1

中文分词—读数学之美

gls_liujia的专栏

09-12

1958

语言统计模型：设S表示一连串特定顺序排列的词：w1,w2,w3,…,wn，S可能是一个有意义的句子。 S在文本中出现的可能性，即P(S)： P(S)=P(w1)*P(w2|w1)*P(w3| w1 w2)…*p(wn| w1 w2 … wn-1) p(w1)表示w1出

参与评论您还未登录，请先登录后发表或查看评论

NLP-基础知识-002 (语言模型)

BUPT-WT的博客

12-01

440

一、Noisy Channel Model p(text|source) = k * p(source|text)P(text) ----> Noisy Channel Model 主要通过贝叶斯定理: p(text|source) = p(source|text)*p(text)/p(source) p(source) 为常数应用场景：语音识别、机器翻译、拼写纠错、OCR、...

统计语言模型（下）

Lenskit

05-05

668

接上篇。 P(wi|wi-1)就是这两个数的比值，再考虑到上面的两个概率有相同的分母（语料库大小），可以约掉，所以P(wi|wi-1)(wi-1,wi)/(wi-1)。现在你是否感受到数学的美妙？它把一些复杂的问题变得如此简单。似乎难以相信，这么简单的数学模型能解决复杂的语音识别、机器翻译等问题，而很复杂的文法规则和人工智能却做不到。其实很多语音学家也质疑过这种方法的有效性，

一、语音识别方法（2）

selectnothing的博客

12-28

245

语音识别方法（2）

思考的乐趣-matrix67数学笔记-pdf

09-12

他鼓励读者跳出常规思维，去发现数学之美，体验思考的乐趣。在基础数学部分，笔记涵盖了代数、几何、概率论等经典领域。例如，在代数中，矩阵67深入浅出地解释了线性方程组的解法，包括高斯消元法、矩阵运算以及...

数学之美-读书笔记-1-5章

鹏鹏的博客

08-30

758

文章目录第1章文字和语言vs数字和信息信息文字和数字文字和语言背后的数学小结第2章 自然语言处理-从规则到统计前言机器智能从规则到统计小结第3章统计语言模型1用数学的方法描述语言规律2延伸阅读2.1高阶语言模型2.2模型的训练、零概率问题和平滑方法2.3语料的选取问题个人总结第4章谈谈分词1中文分词方法的演变2延伸阅读2.1分词的一致性2.2词的颗粒度和层次第5章隐含马尔可夫模型1通信模型...

07-26

07-26

wys578的博客

07-06

5287

前段时间开始看吴军写的一本很经典的书--《数学之美》。然后下面是我的读书小笔记（回忆一下，看自己看进去多少东西）：关于数学的重新认识：从小学到大的数学，在我的认知里，数学就是计算，推理+证明。这本书从人类的起源来演绎了数学的由来。让我印象最深的一句就是：数学：就是通过学习获取知识。世界万物皆可量化，这就意味着全都脱离不了数学。图论和网络爬虫这里讲到哥尼斯堡的...

shell 统计一个词出现的概率_干货满满 | 基于统计的分词算法

weixin_32019373的博客

12-26

552

✖ 导语 ✖本篇主要对分词技术中基于统计的分词方法进行深入的探究，先是介绍了统计方法分词是什么以及一般步骤，随后介绍了语言模型，最后介绍了常见的统计算法(维特比算法)，并实现了统计算法的分词。以下为文章结构，本篇内容干货满满：(阅读全文大概需要20分钟)✖ 统计分词 ✖01统计的分词方法基于统计的分词算法的主要核心是词是稳定的组合，因此在上下文中，相邻的字同时出现的次数越多，就越有可能构成一个词。...

数学之美系列一 -- 统计语言模型

u011860731的专栏

06-17

781

http://www.cnblogs.com/KevinYang/archive/2009/02/01/1381783.html 2006年4月3日上午 08:15:00 发表者: 吴军, Google 研究员前言也许大家不相信，数学是解决信息检索和自然语言处理的最好工具。它能非常清晰地描述这些领域的实际问题并且给出漂亮的解决办法。每当人们应

数学之美笔记1

yang090510118的专栏

09-07

882

不同的文字系统在记录信息上的能力是等价d

Python 最大概率法进行汉语切分

qijingpei的博客

02-16

3756

要求： 1 采用基于语言模型的最大概率法进行汉语切分。 2 切分算法中的语言模型可以采用n-gram语言模型，要求n >1，并至少采用一种平滑方法；代码：废话不说，代码是最好的语言 import re import math MAX_SPLITLEN = 4#最大切分长度 corpus_lib = ''#corpus:语料 def init_corpus_lib(pat...

数学之美——阅读笔记（一）

Step to a New World

03-19

469

自然语言处理的发展以及语言模型的简单介绍

[转]《数学之美》阅读笔记

xiajian2010的专栏

09-13

1595

文字和语言 vs 数字和信息不同的文字系统（包括数学）在记录信息上的能力是等价的。印度人发明了阿拉伯数字，不是阿拉伯人。如果把中文的笔画作为字母，它其实也是一种拼音文字，不过它是二维的而已。所以西方的拼音文字称为罗马式的语言。在东汉以前要将文字刻在其它物件比如龟壳、石碑和竹简上。所以要惜墨如金，这就使得古文异常简洁难懂，而同时期的口语却和今天的白话差别不大（

Word2Vec-语言模型的前世今生

冯大洋的博客

11-27

749

引言在机器学习领域，语言识别和图像识别都比较容易做到。语音识别的输入数据可以是音频频谱序列向量所构成的matrix，图像识别的输入数据是像素点向量构成的矩阵。但是文本是一种抽象的东西，显然不能直接把文本数据喂给机器当做输入，因此这里就需要对文本数据进行处理。现在，有这么一个有趣的例子，我接下来要讲的模型就可以做到。首先给出一个例子，Paris - France + Americ...

数学之美---数学本来就很美

awakeljw的博客

01-16

783

江上白衣凌云

04-07

571

假定s表示一个有意义的句子由w1w2。。wn组成长度为n 求s在文本中出现的概率p(s)=p(w1,w2,...,wn);

深度学习word2vec笔记：理解目标函数与词向量

"目标函数-[代码整洁之道].(美)马丁.扫描版" 本文将探讨《目标函数》这一主题，这是编程实践中的一种重要概念，特别是在深度学习领域。文章提及的"目标函数"通常指的是模型训练中要优化的数学表达式，它是衡量模型...

数学之美--笔记1

1.统计语言模型

一阶马尔科夫假设：p(s)=p(w1)*p(w2|w1)*p(w3|w2)...p(wn|wn-1)，p(wi|wi-1)=p(wi,wi-1)/p(wi-1)。基于条件概率的二元统计语言模型，该模型太过简化，认为一个词的出现只与其前面的一个词相关。

2.隐含马尔科夫模型

一阶马尔科夫假设：p(s)=p(w1)p(w2|w1)p(w3|w2)...p(wn|wn-1)，p(wi|wi-1)=p(wi,wi-1)/p(wi-1)。基于条件概率的二元统计语言模型，该模型太过简化，认为一个词的出现只与其前面的一个词相关。