机器学期——贝叶斯分类实战

本文介绍了贝叶斯分类的基本概念,包括分类流程和方法。详细讲解了贝叶斯分类的背景、概述,特别是贝叶斯定理,并列举了四种贝叶斯分类器。最后,通过垃圾邮件分类的实战案例,展示了如何运用贝叶斯算法进行实际问题的解决。
摘要由CSDN通过智能技术生成

贝叶斯分类实战

一、分类基本概念

1.分类在数据挖掘中的定义:

  • 分类就是把一些新的数据项映射到给定类别的中的某一个类别
  • 分类属于有监督学习,与之相对应的是无监督学习,比如聚类
  • 分类和聚类的最大区别在于,分类数据中的一部分的类别是已知的,而聚类数据的类别未知。

2.分类流程

步骤一、将样本转化为等维的数据特征(特征提取)。所有样本必须具有相同数量的特征。兼顾特征的全面性和独特性。

动物种类 体型 翅膀数量 脚的只数 是否产蛋 是否有毛 类别
0 4 哺乳动物
0 4 哺乳动物
0 4 哺乳动物
麻雀 2 2 鸟类
天鹅 2 2 鸟类
大雁 2 2 鸟类

步骤二、选择与类别相关的特征(特征选择)。上面的翅膀数,脚的只数,是否产蛋为非常相关,种类,体型为部分相关,是否有毛为完全无关

步骤三、建立分了力模型或分类器

分类器通常可以看做一个函数,它把特征映射到类的空间上。
∫ ( x i 1 , x i 2 , x i 3 , x i 4 , x i 5 . . . . . x i n ) → y i \int\left(x_{i1},x_{i2},x_{i3},x_{i4},x_{i5}.....x_{in}\right)\rightarrow y_i

  • 1
    点赞
  • 0
    收藏
    觉得还不错? 一键收藏
  • 0
    评论
评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值