机器学习主要是用来预测,根据已有的数据,对未知的数据做出决策(也可以是对已有的数据聚类),如果已有的数据是带标签的,就是监督学习,无标签的,就是无监督学习。
分类任务
如果是预测类别,那就是分类,分类任务是研究的比较久,也比较成熟的一个任务,例如传统的手写体识别任务就是一个10分类问题、计算机视觉中的物体识别、人脸识别。再比如情感分析中的情感分类(喜怒哀乐)。股市的涨跌。点击预测(二分类)。
机器学习的分类
1. 按照任务类型分,这种分类方法的好处是,当你来一个任务时候,可以立马想到用什么模型去处理
按照任务类型可以分为回归、分类、聚类、降维。
2. 按照模型分类,概率模型(通常是学习出一种联合分布P(X,y),然后根据到来的新点X,预测y)
3. 按照历史的发展,大概分为几个阶段
4. 按照学习的策略(度量学习、集成学习)
传统机器学习
度量学习
在数学中,一个度量(或距离函数)是一个定义集合中元素之间距离的函数。一个具有度量的集合被称为度量空间。
很多的算法越来越依赖于在输入空间给定的好的度量。例如
K-means
、
K
近邻方法、
SVM
等算法需要给定好的度量来反映数据间存在的一些重要关系。这一问题在无监督的方法(如聚类)中尤为明显。
多核学习
多核学习技术
多核学习方法是当前核机器学习领域的一个新的热点. 核方法是解决非线性模式分析问题的一种有效方法, 但在一
些复杂情形下, 由单个核函数构成的核机器并不能满足诸如数据异构或不规则、样本规模巨大、样本不平坦分布等实际的应用
需求, 因此将多个核函数进行组合, 以获得更好的结果是一种必然选择.
支持向量机
支持向量机的英文名称是 SVM(Support Vector Machine)