文章目录 朴素贝叶斯算法原理 精确率和召回率 交叉验证与网格搜索对K-近邻算法调优 网格搜索 朴素贝叶斯算法原理 将三篇文章划分为三个类别的概率是多少,即占得比例。 即贝叶斯思想,预测你这篇文档属于这10个类别的每个概率是多少,找出最大的概率即可。 求在给定文档的词下,属于哪个类别的概率。 之后可以选择每篇文章的重要性大的前几个词,可以找到一些比较重要的词进行统计了。每篇文章都可以将重要的词拿出来,就可以组成一个新的词列表。