现在是大数据时代,海量数据影响着我们生活的方方面面。生活在当今时代的攻城狮,多多少少要对这个有点了解,不然就显得逼格不够高哈。大数据处理中最常用就是对数据进行分类,统计,关联分析等。这篇博客介绍下朴素贝叶斯分类算法在数据分类中的一个应用,举一个例子并使用java对其进行实现 ,借此也巩固下我所学的知识。
一,什么是朴素贝叶斯分类算法
回答这个问题首先要谈下什么是分类。其实这个很好理解,就比如看到一个陌生人,你通过他的穿着举止从而判断他十有八九是个程序猿,那这就是一个分类。
1.贝叶斯定理
对于事件A和事件B,满足以下关系:
P(A|B)=P(B|A)P(A)/P(B)
其中P(B|A)表示事件A发生的条件下事件B发生的概率。但通常情况下,如果我们更需要知道事件B发生条件下事件A发生的概率时,贝叶斯定理就及其有用。
2.朴素贝叶斯分类算法
朴素贝叶斯分类的正式定义如下:
1、设为一个待分类项,比如举个例子,它是否是程序猿。
2、有类别集合。这里可以理解为是一个人的各种特征。
3、计算。分别计算各个特征的概率。
4、如果,则