文本分类与LDA

最新推荐文章于 2024-05-15 18:38:16 发布

sir_TI

最新推荐文章于 2024-05-15 18:38:16 发布

阅读量2k

点赞数

分类专栏： Deep learning 文章标签：文本分类 LDA

版权声明：本文为博主原创文章，遵循 CC 4.0 BY-SA 版权协议，转载请附上原文出处链接和本声明。

本文链接：https://blog.csdn.net/sir_TI/article/details/94344275

版权

本文介绍了文本分类的实战应用，详细讲解了朴素贝叶斯的三种分类器，并探讨了LDA主题模型，包括其与贝叶斯模型的关系、共轭分布、狄利克雷分布以及采样原理。

摘要由CSDN通过智能技术生成

文本分类实战

本文主要是针对实战来进行设置的，假设你之前已经了解了朴素贝叶斯和支持向量机（SVM）的基础知识了。现在想从代码的层面去实战文本分类，那么这篇文章可以加深你对这两个算法的理解。

1.使用朴素贝叶斯进行文本分类

在sklearn的实现中，涉及到朴素贝叶斯的主要是三个类：

1.1 `GaussianNB`类

GaussianNB假设特征的先验概率为正态分布,即满足下式：
$P(X_j=x_j|Y=C_k)=\frac{1}{\sqrt{2\pi\sigma^2}}exp(-\frac{(x_j-\mu_k)^2}{2\sigma_k^2})$
其中 $C_k$ 为Y的第k类类别。 $\mu_k$ 和 $\sigma_k^2$ 为需要从训练集估计的值。

GaussianNB会根据训练集求出 $\mu_k$ 和 $\sigma_k^2$ 。 $\mu_k$ 为在样本类别 $C_k$ 中，所有 $X_j$ 的平均值。 $\sigma_k^2$ 为在样本类别CkCk中，所有 $X_j$ 的方差。

GaussianNB类的主要参数仅有一个，即先验概率priors ，对应Y的各个类别的先验概率 $P(Y=C_k)$

最低0.47元/天解锁文章

关注

0
点赞
踩
10

收藏

觉得还不错? 一键收藏
2
评论
文本分类与LDA

文本分类实战本文主要是针对实战来进行设置的，假设你之前已经了解了朴素贝叶斯和支持向量机（SVM）的基础知识了。现在想从代码的层面去实战文本分类，那么这篇文章可以加深你对这两个算法的理解。1.使用朴素贝叶斯进行文本分类在sklearn的实现中，涉及到朴素贝叶斯的主要是三个类：1.1 GaussianNB类GaussianNB假设特征的先验概率为正态分布,即满足下式：P(Xj=xj∣Y=C...
复制链接

扫一扫

专栏目录

评论 2

被折叠的条评论为什么被折叠?

到【灌水乐园】发言

查看更多评论

添加红包

成就一亿技术人!

hope_wisdom

发出的红包

实付元

使用余额支付

点击重新获取

扫码支付

钱包余额 0

抵扣说明：

1.余额是钱包充值的虚拟货币，按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载，可以购买VIP、付费专栏及课程。