数据挖掘及应用(莫同老师)—— 课程笔记(四)分类基础

一、特征与分类

人类认知事物:

  1. 分类(有不同之处)
  2. 关联(有相同之处)
  3. 特征

特征的作用:

 

特征的关键作用——分类

  1. 已知分类特征,对样本进行归类。
  2. 已知样本分类,抽取类别特征。

人:吃两次苹果就记住了这是苹果,不需要几百万次。

 

如何分类?——学习

 

  1. 有指导学习
  2. 无指导学习

二、概率基础

数学:现实规律的抽象表述。

面对现实问题,找到相应的数学来抽象和解决。

概率论是一门研究随机现象的数量规律的学科。

决定性现象:

  1. 必然事件
  2. 不可能事件

不确定现象:

在基本条件保存不变的情况下,一系列试验或观察会得到不同的结果,是随机现象。

 

当前的许多热点问题本质上是一个概率问题:推荐系统等。

随机试验:

  1. 可以在相同条件下重复进行。
  2. 每次试验的结果不止一个,但结果事先可以预知。
  3. 每次试验前不能确定哪个结果会出现。

样本空间:

样本点:

频率:

频率稳定性:

条件概率:

乘法定理:

 

三、贝叶斯分类

通过贝叶斯分类有什么问题?

假设条件太多,特别多的时候不好用。

 

解决之道?

奥卡姆剃刀

 

朴素贝叶斯:彼此不相关

 

评论
添加红包

请填写红包祝福语或标题

红包个数最小为10个

红包金额最低5元

当前余额3.43前往充值 >
需支付:10.00
成就一亿技术人!
领取后你会自动成为博主和红包主的粉丝 规则
hope_wisdom
发出的红包
实付
使用余额支付
点击重新获取
扫码支付
钱包余额 0

抵扣说明:

1.余额是钱包充值的虚拟货币,按照1:1的比例进行支付金额的抵扣。
2.余额无法直接购买下载,可以购买VIP、付费专栏及课程。

余额充值