机器学习简介（传统、新兴、大规模机器学习）

最新推荐文章于 2023-04-14 13:56:36 发布

sheldonwong

最新推荐文章于 2023-04-14 13:56:36 发布

阅读量1.3k

点赞数

分类专栏：机器学习

本文链接：https://blog.csdn.net/sheldonwong/article/details/79210563

版权

  机器学习主要是用来预测，根据已有的数据，对未知的数据做出决策（也可以是对已有的数据聚类），如果已有的数据是带标签的，就是监督学习，无标签的，就是无监督学习。 

 
 分类任务 

  如果是预测类别，那就是分类，分类任务是研究的比较久，也比较成熟的一个任务，例如传统的手写体识别任务就是一个10分类问题、计算机视觉中的物体识别、人脸识别。再比如情感分析中的情感分类（喜怒哀乐）。股市的涨跌。点击预测（二分类）。 

 
 机器学习的分类 

  1. 按照任务类型分，这种分类方法的好处是，当你来一个任务时候，可以立马想到用什么模型去处理 

  按照任务类型可以分为回归、分类、聚类、降维。 

  2. 按照模型分类，概率模型（通常是学习出一种联合分布P(X,y),然后根据到来的新点X，预测y） 

  3. 按照历史的发展，大概分为几个阶段 

  4. 按照学习的策略（度量学习、集成学习） 

 
 在数学中，一个度量（或距离函数）是一个定义集合中元素之间距离的函数。一个具有度量的集合被称为度量空间。 

 
 很多的算法越来越依赖于在输入空间给定的好的度量。例如 
 K-means 
 、 
 K 
 近邻方法、 
 SVM 
 等算法需要给定好的度量来反映数据间存在的一些重要关系。这一问题在无监督的方法（如聚类）中尤为明显。 

 
 多核学习技术 

 
  多核学习方法是当前核机器学习领域的一个新的热点. 核方法是解决非线性模式分析问题的一种有效方法, 但在一 

 
 些复杂情形下, 由单个核函数构成的核机器并不能满足诸如数据异构或不规则、样本规模巨大、样本不平坦分布等实际的应用 

 
 需求, 因此将多个核函数进行组合, 以获得更好的结果是一种必然选择.  

 
 支持向量机 

 
     支持向量机的英文名称是 SVM(Support Vector Machine)

关注