一、特征与分类
人类认知事物:
- 分类(有不同之处)
- 关联(有相同之处)
- 特征
特征的作用:
特征的关键作用——分类
- 已知分类特征,对样本进行归类。
- 已知样本分类,抽取类别特征。
人:吃两次苹果就记住了这是苹果,不需要几百万次。
如何分类?——学习
- 有指导学习
- 无指导学习
二、概率基础
数学:现实规律的抽象表述。
面对现实问题,找到相应的数学来抽象和解决。
概率论是一门研究随机现象的数量规律的学科。
决定性现象:
- 必然事件
- 不可能事件
不确定现象:
在基本条件保存不变的情况下,一系列试验或观察会得到不同的结果,是随机现象。
当前的许多热点问题本质上是一个概率问题:推荐系统等。
随机试验:
- 可以在相同条件下重复进行。
- 每次试验的结果不止一个,但结果事先可以预知。
- 每次试验前不能确定哪个结果会出现。
样本空间:
样本点:
频率:
频率稳定性:
条件概率:
乘法定理:
三、贝叶斯分类
通过贝叶斯分类有什么问题?
假设条件太多,特别多的时候不好用。
解决之道?
奥卡姆剃刀
朴素贝叶斯:彼此不相关