『数据挖掘、机器学习』常用算法思路、原理、公式、优缺点

最新推荐文章于 2022-08-07 17:34:19 发布

onlyfansnft.art

最新推荐文章于 2022-08-07 17:34:19 发布

阅读量764

点赞数

分类专栏：数据挖掘机器学习文章标签：数据挖掘机器学习大数据算法

本文链接：https://blog.csdn.net/Sbtgmz/article/details/61921003

版权

数据挖掘同时被 2 个专栏收录

25 篇文章 1 订阅

订阅专栏

机器学习

22 篇文章 0 订阅

订阅专栏

                    
                    1、朴素贝叶斯分类算法 
思路：通过计算在已知样本特征 X 下，该样本被分类为  
   
   Ci 
   类的概率，并取取得最大的概率的类为该样本所属分类 
假设：假设每个特征相互独立 
公式： 
已知  
   
   X=(x1,x2,...,xn) 
  ,  
   
   y=(C1,C2,...,Cm) 
   ，  
   
   X 
   是  
   
   n 
  维向量， 
   
   y 
   是  
   
   m 
   维向量 
 
    P(Ci|X)=P(Ci)∏nk=1P(xk|Ci)∑mi=1P(Ci)P(X|Ci)(1) 
    
(1) 式中的分母由于对于每个 (1) 式来说都是相同，可以在实际计算中省略不使用 
另外  
   
   P(X|Ci) 
   ，由于  
   
   X=(x1,x2,...,xn) 
   ，故  
   
   P(X|Ci) 
   可写成  
   
   P(x1,x2,...,xn|Ci) 
   ， 
而  
   
   P(x1,x2,...,xn|Ci) 
   又可以写成  
   
   ∏nk=1P(xk|Ci) 
   故 (1) 式可改写为： 
 
    P(Ci|X)=P(Ci)∏nk=1P(xk|Ci)∑mi=1P(Ci)∏nk=1P(xk|Ci)(2) 
    
由 (2) 式的分母可以明显看出对于每一个样本 X 来说，分母都是相同的。 
优点：方法简单、准确率高、计算速度快 
缺点：假设每个特征相互独立的假设过强，不太符合实际；需要知道先验概率；样本数据量要比较多，这样得到的后验概率才比较准确

onlyfansnft.art

关注

0
点赞
踩
0

收藏

觉得还不错? 一键收藏
0
评论
『数据挖掘、机器学习』常用算法思路、原理、公式、优缺点

1、朴素贝叶斯分类算法思路：通过计算在已知样本特征 X 下，该样本被分类为 CiC_i 类的概率，并取取得最大的概率的类为该样本所属分类假设：假设每个特征相互独立公式：P(Ci|X)=P(Ci)∏nk=1P(xk|Ci)∑ni=1P(Ci)P(X|Ci)(1) P(Ci|X) = \frac{P(C_i)\prod_{k=1}^{n}P(x_k|C_i) }{\sum_{i=1}^{n}P(C_i)
复制链接

扫一扫