叶斯分类器的应用
-
- 题目的主要研究内容
(1)小组的主要任务描述
我们组主要从三个方面做贝叶斯分类器的应用领域大综述,分别是:贝叶斯分类算法在数据预测中的应用及综述、朴素贝叶斯分类器在智能导诊中的应用和贝叶斯分类在职业性格分析中的应用。
(2)自己工作的主要描述
查找贝叶斯分类算法在数据预测中的应用及综述部分的资料与文献。
1.2 应用综述:
贝叶斯在很多方面都有应用,文本分类/垃圾文本过滤/情感判别,这是朴素贝叶斯应用最多的地方,现在的分类器有很多,但是在文本分类的场景中,朴素贝叶斯依旧占据着一席之地,因为多分类很简单,同时在文本数据中,分布独立这个假设基本是成立的。然而像垃圾文本过滤(比如垃圾邮件识别)和情感分析(微博上的褒贬情绪)用朴素贝叶斯也通常能取得很好的效果。多分类实时预测:这个不算场景吧,对于文本相关的多分类实时预测,它因为上面提到的优点,被广泛应用,简单又高效。推荐系统:朴素贝叶斯和协同过滤(Collaborative Filtering)是一对好搭档,协同过滤是强相关性,但是泛化能力略弱,朴素贝叶斯和协同过滤一起,能增强推荐的覆盖度和效果。
1.3 贝叶斯分类算法在数据预测中的应用
利用数据挖掘中的朴素贝叶斯分类技术来研究鸢尾花数据集中有关于鸢尾花分类问题。以鸢尾花数据集为对象, 尝试通过数据挖掘中的朴素贝叶斯分类技术对数据进行分析, 实现对鸢尾花所属分类进行预测, 发现鸢尾花所属分类与鸢尾花各项数据之间的联系, 有助于对鸢尾花的培养进行管理。
鸢尾花数据集中数据属性分为花萼长 、花萼宽 、花瓣长 、花瓣宽和所属分类 5 项。为了编程方便, 使用 calyx length 表示花萼长 、calyx width 表示花萼宽 、petal length 表示花瓣长 、petal width 表示花瓣宽 、category 表示所属分类如表1所示 。
1.3.1设计思想