![](https://img-blog.csdnimg.cn/20201014180756930.png?x-oss-process=image/resize,m_fixed,h_64,w_64)
统计方法
文章平均质量分 83
CANDY_J
这个作者很懒,什么都没留下…
展开
-
朴素贝叶斯算法
1.基本思想贝叶斯分类算法是统计学的一种概率分类方法,朴素贝叶斯分类是贝叶斯分类中最简单的一种。其分类原理就是利用贝叶斯公式根据某特征的先验概率计算出其后验概率,然后选择具有最大后验概率的类作为该特征所属的类。它主要的思想就是假设:所有的特征之间是条件独立的,这样就简化了运算。所谓的“所有特征之间是条件独立的”是指:假设某个样本有x1,x2,…,xn个特征,如果有:P(X)=P(x1,x2,...,xn)=P(x1)∗P(x2)∗...∗P(xn)P(X) = P(x_1,x_2,...,x_n) =原创 2021-02-14 16:24:16 · 1670 阅读 · 0 评论 -
TF-IDF算法
1.算法思路通常情况下,如果某个词很重要,它在某一篇文章中出现的频率相对来说是比较高的。所以,可以通过"词频"(Term Frequency,缩写为TF)进行统计。但是,像”的“、”是“等停用词几乎在所有文章中出现的次数都挺高,但却没有什么实际的意义。相反,如果某个词在其他文章中比较少见,但是它在某一篇文章中多次出现,那么它就很可能是这篇文章的关键词。所以,就需要在词频的基础上引入权重的概念——即“逆文档频率”(Inverse Document Frequency,缩写为IDF)。对于几乎在所有文章中都原创 2021-02-14 16:19:43 · 199 阅读 · 0 评论