一、分类
有监督学习的两大应用之一,产生离散的结果。分类方法是一种对离散型随机变量建模或预测的监督学习算法。
从机器学习的观点,分类技术是一种有指导的学习,即每个训练样本的数据对象已经有类标识,通过学习可以形成表达数据对象与类标识间对应的知识。
要构造分类器,需要有一个训练样本数据集作为输入。训练集由一组数据库记录或元组构成,每个元组是一个由有关字段(又称属性或特征)值组成的特征向量,此 外,训练样本还有一个类别标记。一个具体样本的形式可表示为:(v1,v2,…,vn; c);其中vi表示字段值,c表示类别。分类器的构造方法有统计方法、机器学习方法、神经网络方法等等。
二、聚类
无监督学习的结果。聚类的结果将产生一组集合,集合中的对象与同集合中的对象彼此相似,与其他集合中的对象相异。 聚类是一种无监督学习任务,该算法基于数据的内部结构寻找观察样本的自然族群(即集群)。
在机器学习中,聚类是一种无指导学习。也就是说,聚类是在预先不知道欲划分类的情况下,根据信息相似度原则进行信息聚类的一种方法。
常见的聚类算法包括:
K-均值聚类算法(K-mensclustering)则是最典型的聚类算法
属于划分法K中心点(K-MEDOIDS)算法、CLARANS算法;
属于层次法的BIRCH算法、CURE算法、CHAMELEON算法等;
三、回归
3.回归(regression)
有监督学习的两大应用之一,产生连续的结果。 回归方法是一种对数值型连续随机变量进行预测和建模的监督学习算法。如线性回归、回归树。
机器学习之——分类 聚类 回归
最新推荐文章于 2024-06-25 20:25:00 发布