数据分类分析
监督学习
基本概念
分类任务就是通过学习得到一个目标函数f,把每个属性集x映射到预先定义的类标号y。
一般方法
- 决策树分类法
- 基于规则的分类法
- 神经网络
- 支持向量机
- 朴素贝叶斯分类法
均采用一种学习算法(learning algorithm)确定分类模型
主要目标 :建立一个具有很好的泛化能力的模型,即能正确预测未知样本类标号的模型。
无监督学习
聚类分析
(无监督分类)是一个把数据对象划分成子集的过程,每个子集都是一个簇(cluster),使得簇中的对象彼此相似,但与其它簇中的对象不相似。组内的相似性越大,组间的差别越大,聚类就越好。
聚类方法
- 划分方法
- 层次方法
- 基于密度的方法
- 基于网格的方法
- 基于模型的方法