NLP-文本表示

最新推荐文章于 2023-01-07 09:34:56 发布

Autter

最新推荐文章于 2023-01-07 09:34:56 发布

阅读量255

点赞数

分类专栏：学习记录文章标签： NLP

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/qq_23609603/article/details/90383472

版权

学习记录专栏收录该内容

27 篇文章 0 订阅

订阅专栏

一、朴素贝叶斯

1.1 朴素贝叶斯理论

朴素贝叶斯的原理：
基于朴素贝叶斯公式，比较出后验概率的最大值来进行分类，后验概率的计算是由先验概率与类条件概率的乘积得出，先验概率和类条件概率要通过训练数据集得出，即为朴素贝叶斯分类模型，将其保存为中间结果，测试文档进行分类时调用这个中间结果得出后验概率。

那什么是朴素贝叶斯？
贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分类。而朴素朴素贝叶斯分类是贝叶斯分类中最简单，也是常见的一种分类方法。
贝叶斯公式：

贝叶斯公式：
在这里插入图片描述
X:特征向量 Y：类别
先验概率 P(X)：是指根据以往经验和分析得到的概率。
后验概率 P(Y|X)：事情已经发生，要求这件事情发生的原因是由某个因素引起的可能性的大小。
类条件概率 P(X|Y)：在已知某类别的特征空间中，出现特征值X的概率密度。

朴素：朴素贝叶斯算法是假设哥哥特征之间相互独立，也是朴素的意思。由此，P(X|Y)就可以写成：
在这里插入图片描述

模型原理与训练

朴素贝叶斯分类器是一种有监督学习，常见有三种模型，多项式模型(multinomial model)即为词频型和伯努利模型(Bernoulli model)即文档型，还有一种高斯模型。
前二者的计算粒度不一样，多项式模型以单词为粒度，伯努利模型以文件为粒度，因此二者的先验概率和类条件概率的计算方法都不同。计算后验概率时，对于一个文档d，多项式模型中，只有在d中出现过的单词，才会参与后验概率计算，伯努利模型中，没有在d中出现，但是在全局单词表中出现的单词，也会参与计算，不过是作为“反方”参与的。这里暂不考虑特征抽取、为避免消除测试文档时类条件概率中有为0现象而做的取对数等问题。

未完待续。。。

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
NLP-文本表示

一、朴素贝叶斯1.1 朴素贝叶斯理论朴素贝叶斯的原理：基于朴素贝叶斯公式，比较出后验概率的最大值来进行分类，后验概率的计算是由先验概率与类条件概率的乘积得出，先验概率和类条件概率要通过训练数据集得出，即为朴素贝叶斯分类模型，将其保存为中间结果，测试文档进行分类时调用这个中间结果得出后验概率。那什么是朴素贝叶斯？贝叶斯分类是一类分类算法的总称，这类算法均以贝叶斯定理为基础，故统称为贝叶斯分...
复制链接

扫一扫

专栏目录

博客等级

码龄10年

56
原创

17
点赞

96
收藏

10
粉丝

关注

私信

热门文章

分类专栏

最新评论

8.8 网易笔试
Autter 回复 UestcXR: maxval +1 ，或者 left <= right 都是可以的，max 的值就是最大的满足条件的值，就是取到 e + m + h + em + mh 也是无所谓的，因为二分查找会缩小搜索区间
8.8 网易笔试
UestcXR 回复 Autter: 抱歉，没注意你的赋值那段代码。你的代码没错的，不应该加1，加一的话会使得max的值多一个的
8.8 网易笔试
Autter 回复 UestcXR: [code=java] int e = nums[0]; int m = nums[2]; int h = nums[4]; int em = nums[1]; int mh = nums[3]; [/code] 输入没问题的哈
8.8 网易笔试
UestcXR 回复 Autter: right = maxVal + 1是错的，不用加1也能取到3.你这只是键盘输入的顺序错了，正确的应该是E EM M MH H你的是 E M H EM MH
8.8 网易笔试
Autter 回复 weixin_37119138: 整体逻辑是没有错误的，问题出现在二分查找时最大值 right 的设置，应该设置为 right = maxval+1，之前的设置最大值都取不到3，，，

最新文章

目录

评论

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。