【分类】就是通过学习得到一个目标函数(通常也称作分类模型,即分类器),借助分类器将未知类别的数据对象映射到某一个给定的类别中。分类和回归都可以用于预测。分类的目标属性(因变量)是离散属性(名词型),而回归的目标属性(因变量)是连续属性(数值型)。 分类和聚类的区别在于,分类要求训练集必须给定类别标签,同时构建的分类器可以用于预测,而聚类用于对于未知类别的样本进行训练,发现相似群体,并人工根据群体特征,赋予类别标签
分类算法在解决实际问题时经常会把数据拆分为两个数据集:训练数据集、测试数据集。通过数据挖掘算法对训练数据集进行建模,寻找X和Y之间的数学模型,然后通过测试数据集来验证该数学模型的准确率,如果误差能够达控制到一定精度,则认为该模型很好的反映了X和Y的关系,可以用来进行预测和分析。
分类:典型案例(变压器故障诊断)
电力变压器是电力系统的重要输变电设备,油中溶解气体分析法是发现和预防变压器故障的有效方法之一。可以利用分类算法对变压器的油色谱检测数据进行分析,以此指导设备的故障诊断并判断设备的状态。 以某站主变压器为研究对象